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ANÁLISIS MATEMÁTICO 



Si una cantidad no negativa fuera tan pequeña 
que resultara menor que cualquier otra dada, cier- 
tamente no podría ser sino cero. A quienes pregun- 
tan qué es una cantidad inñnitamente pequeña en 
matemáticas, nosotros respondemos que es, de he- 
cho, cero. Así pues, no hay tantos misterios ocultos 
en este concepto como se suele creer. Esos supues- 
tos misterios han convertido el cálculo de lo inñnita- 
mente pequeño en algo sospechoso para mucha gente. 
Las dudas que puedan quedar las resolveremos por 
completo en las páginas siguientes, donde explicare- 
mos este cálculo. 

Leonhard Euler 
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En el siglo XVII Newton y Leibniz descubren independientemente el análisis 
matemático o cálculo infinitesimal, una potentísima herramienta que revolucionó 
el tratamiento matemático de la física y la geometría, y que más tarde impreg- 
naría las más diversas ramas de la matemática, como la estadística o la teoría 
de números. 

Esencialmente, el cálculo infinitesimal consistía por una parte en analizar 
o descomponer la dependencia entre varias magnitudes estudiando el compor- 
tamiento de unas al variar o diferenciar levemente otras (lo que constituía el 
cálculo diferencial) y por otra parte en integrar los resultados diferenciales para 
obtener de nuevo resultados globales sobre las magnitudes en consideración (el 
llamado cálculo integral). 

Es difícil que un lector que no tenga ya algunas nociones de cálculo pueda 
entender cabalmente el párrafo anterior, pero las nuevas ideas eran aún más 
difíciles de entender de la pluma de sus descubridores. El primer libro de texto 
que se publicó con el fin de explicarlas sistemáticamente fue el "Análisis" del 
marqués de l'Hópital. Veamos algunos pasajes: 

La parte infinitamente pequeña en que una cantidad variable es au- 
mentada o disminuida de manera continua, se llama la diferencial 
de esta cantidad. 

Siguiendo la notación leibniziana, L'Hópital explica que la letra d se usa para 
representar uno de estos incrementos infinitamente pequeños de una magnitud, 
de modo que dx representa un incremento diferencial de la variable x, etc. 

En ningún momento se precisa qué debemos entender por un aumento infi- 
nitamente pequeño de una cantidad, pero en compensación se presentan varias 
reglas para tratar con diferenciales. Por ejemplo: 

Postúlese que dos cantidades cuya diferencia es una cantidad infini- 
tamente pequeña pueden intercambiarse una por la otra; o bien (lo 
que es lo mismo) que una cantidad que está incrementada o dismi- 
nuida solamente en una cantidad infinitamente menor, puede consi- 
derarse que permanece constante. 

Así, por ejemplo, si analizamos el incremento infinitesimal que experimenta 
un producto xy cuando incrementamos sus factores, obtenemos 

d(xy) = (x + dx) (y + dy) — xy = x dy + y dx + dxdy = xdy + ydx, 
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donde hemos despreciado el infinitésimo doble dxdy porque es infinitamente 
menor que los infinitésimos simples xdy e ydx. 

Es fácil imaginar que estos razonamientos infinitesimales despertaron sospe- 
chas y polémicas. Baste citar el título del panfleto que en 1734 publicó el obispo 
de Berkeley: 

El analista, o discurso dirigido a un matemático infiel, donde se 
examina sí los objetos, principios e inferencias del análisis moderno 
están formulados de manera más clara, o deducidos de manera más 
evidente, que los misterios religiosos y los asuntos de la fe. 

En esta fecha el cálculo infinitesimal tenía ya más de medio siglo de historia. 
La razón por la que sobrevivió inmune a estas críticas y a la vaguedad de sus 
fundamentos es que muchos de sus razonamientos infinitesimales terminaban en 
afirmaciones que no involucraban infinitésimos en absoluto, y que eran confir- 
mados por la física y la geometría. Por ejemplo, consideremos la circunferencia 
formada por los puntos que satisfacen la ecuación 

x 2 + y 2 = 25. 

Aplicando la regla del producto que hemos "demostrado" antes al caso en que 
los dos factores son iguales obtenemos que dx 2 = 2x dx e igualmente será dy 2 = 
2ydy. Por otra parte, (¿25 = 0, pues al incrementar la variable x la constante 
25 no se ve incrementada en absoluto. Si a esto añadimos que la diferencial de 
una suma es la suma de las diferenciales resulta la ecuación diferencial 

2xdx + 2ydy = 0, 

de donde a su vez 

dy x 
dx y 

Esto significa que si tomamos, por ejemplo, el punto (3,4) de la circun- 
ferencia e incrementamos infinitesimalmente su coordenada x, la coordenada y 
disminuirá en 3/4 cía;. Notemos que esto es falso para cualquier incremento finito 
de la variable x, por pequeño que sea, pues si valiera para incrementos suficien- 
temente pequeños resultaría que la circunferencia contendría un segmento de la 
recta 

y-4=-j(x-3), 

lo cual no es el caso. Vemos que ésta se comporta igual que la circunferencia para 
variaciones infinitesimales de sus variables alrededor del punto (3,4), aunque 
difiere de ella para cualquier variación finita. La interpretación geométrica es 
que se trata de la recta tangente a la circunferencia por el punto (3,4). 

El argumento será nebuloso y discutible, pero lo aplastante del caso es que 
nos proporciona un método sencillo para calcular la tangente a una circunferen- 
cia por uno cualquiera de sus puntos. De hecho el método se aplica a cualquier 
curva que pueda expresarse mediante una fórmula algebraica razonable, lo que 
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supera con creces a las técnicas con las que contaba la geometría analítica antes 
del cálculo infinitesimal. 

A lo largo del siglo XIX la matemática emprendió un proceso de funda- 
mentación que terminó con una teoría formal donde todos los conceptos están 
perfectamente definidos a partir de unos conceptos básicos, los cuales a su vez 
están completamente gobernados por unos axiomas precisos. Las ambigüedades 
del cálculo infinitesimal fueron el motor principal de este proceso. En los años 
sesenta del siglo XX se descubrió que una delicada teoría lógica, conocida como 
análisis no estándar permite definir rigurosamente cantidades infinitesimales 
con las que fundamentar el cálculo a la manera de Leibniz y L'Hópital, pero no 
es ése el camino habitual ni el que nosotros vamos a seguir. Lo normal es erra- 
dicar los infinitésimos de la teoría, pero no así el formalismo infinitesimal. En 
ocasiones los símbolos dy, dx aparecen en ciertas definiciones "en bloque", sin 
que se les pueda atribuir un significado independiente, como cuando se define 
la derivada de una función y = y(x) mediante 

dy = y(x + Ax) - y(x) 

dx Ax^o Ax 

De este modo, el cociente de diferenciales tiene el mismo significado que 
para Leibniz, en el sentido de que al calcularlo obtenemos el mismo número o 
la misma función que él obtenía, pero con la diferencia de que ya no se trata de 
un cociente de diferenciales, no es un cociente de nada. La definición anterior 
nos permite hablar de dy/dx, pero no de dy o de dx. 

No obstante se puede ir más lejos y dar una definición adecuada de dx y dy 
de modo que se pueda probar la equivalencia 

^ = f(x) <^=> dy = f(x) dx. 
dx 

Es algo parecido al paso de una relación algebraica como xy 2 = x + 4y 3 , 
donde x e y son, digamos, números reales indeterminados, a la misma expresión 
entendida como una igualdad de polinomios, donde ahora x e y son indetermina- 
das en un sentido matemático muy preciso. Por ejemplo, según una definición 
habitual del anillo de polinomios M[x,y], la indeterminada x es la aplicación 
de los pares de números naturales en R dada por x(l,0) = 1 y x(i,j) = 0 
para cualquier otro par, es decir, algo que en nada recuerda a "un número real 
indeterminado" . 

Al introducir las formas diferenciales muchos libros modernos insisten en 
recalcar que los objetos como dx son "puramente formales" — como las indeter- 
minadas en un anillo de polinomios — , que no tienen un singificado intrínseco, 
sino que simplemente son objetos diseñados para que se comporten según ciertas 
reglas que se adaptan a las propiedades de las derivadas e integrales. Llegan 
incluso a perdir disculpas por lo excesivamente vacía y abstracta que resulta la 
teoría en torno a ellos. Explican que, pese a ello, merece la pena el esfuerzo de 
familiarizarse con ella porque al final se ve su gran (y sorprendente) utilidad. 

En este libro insistiremos en todo momento en que las diferenciales tienen 
un significado intrínseco muy concreto e intuitivo, y trataremos de evidenciarlo 
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desde el primer momento, de modo que — sin desmerecer la profundidad de la 
teoría — su utilidad y buen comportamiento no resulta sorprendente en absoluto. 
Su interpretación no será, naturalmente la de incrementos infinitesimales, sino 
la de aproximaciones lineales, aceptables — al menos — en los alrededores de los 
puntos. Esta interpretación los mantiene en todo momento muy cerca de los 
hipotéticos infinitésimos en los que están inspirados. 

Muchos libros de física continúan trabajando con razonamientos infinitesi- 
males al estilo antiguo, los cuales les permiten llegar rápidamente y con fluidez 
a resultados importantes a cambio de sacrificar el rigor lógico. Aquí adopta- 
remos una posición intermedia entre los dos extremos: seremos rigurosos, pero 
no formalistas, daremos pruebas sin saltos lógicos, pero llegaremos a resultados 
enunciados de tal modo que resulten "transparentes" en la práctica, emulando 
así la fluidez de los razonamientos infinitesimales. 

Hay un caso en que los razonamientos infinitesimales están plenamente jus- 
tificados, y es cuando se trata de motivar una definición. Por ejemplo, a partir 
de la ley de gravitación de Newton para dos masas puntuales puede "deducirse" 
que el campo gravitatorio generado por una distribución continua de masa con- 
tenida en un volumen V con densidad p viene dado por 



La deducción no puede considerarse una demostración matemática, pues 
la fórmula anterior tiene el status lógico de una definición, luego es un sin- 
sentido tratar de demostrarla. En todo caso se podría complicar la definición 
sustituyéndola por otra que mostrara claramente su conexión con las masas 
puntuales y después probar que tal definición es equivalente a la anterior. La 
prueba se basaría en la posibilidad de aproximar integrales por sumas finitas 
y con toda seguridad sería bastante prolija. Esta opción sería absurda tanto 
desde el punto de vista formal (¿para qué sustituir una definición sencilla por 
otra complicada?) como desde el punto de vista físico (¿para qué entrar en 
disquisiciones e—S que acabarán donde todos sabemos que tienen que acabar?). 
En cambio, un argumento en términos de infinitésimos convence a cualquiera 
de que esta definición es justamente la que tiene que ser. 1 

Del mismo modo podemos convencernos de que el potencial gravitatorio 
determinado por una distribución de masa p debe ser 



Ahora bien, de aceptar ambos hechos tendríamos como consecuencia la re- 
lación E = — VV, pues el potencial de un campo de fuerzas es por definición 
la función que cumple esto. Sin embargo esto ya no es una definición, sino una 
afirmación sobre dos funciones que podría ser falsa en principio y que, por con- 
siguiente, requiere una demostración. Muchos libros de física dan por sentado 

1 A cualquiera menos a un formalista puro, quien no le encontrará sentido, pero es que, 
como alguien dijo, "un formalista es alguien incapaz de entender algo a menos que carezca de 
significado." 




yll 3 



(x - y) dy. 
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este hecho, incurriendo así en una laguna lógica que nosotros cubriremos. Así 
pues, cuando el lector encuentre en las páginas que siguen un razonamiento en 
términos de diferenciales deberá observar que o bien desemboca en una defi- 
nición o bien está completamente avalado por teoremas previos que justifican 
las manipulaciones de diferenciales. 

Este libro ha sido escrito siguiendo cuatro guías principales: 

• Presentar los resultados más importantes del análisis matemático real. 
Concretamente abordamos el cálculo diferencial e integral de una y va- 
rias variables reales, las ecuaciones diferenciales ordinarias y, aunque no 
hay ningún capítulo dedicado específicamente a ellas, estudiamos varias 
ecuaciones en derivadas parciales: la ecuación de Lagrange, la de Poisson, 
la ecuación de ondas y las ecuaciones de Maxwell. También planteamos 
la ecuación del calor, si bien no entramos en su estudio. Aunque, como 
ya hemos dicho, nos centramos en el análisis real, estudiamos las series 
de potencias complejas, introduciendo en particular la exponencial y las 
funciones trigonométricas complejas, y a partir de la teoría de funciones 
harmónicas y el teorema de Stokes demostramos algunos de los resultados 
fundamentales sobre las funciones holomorfas (esencialmente el teorema 
de los residuos). 

• Justificar todas las definiciones, sin caer en la falacia formalista de que 
la lógica nos da derecho a definir lo que queramos como queramos sin 
tener que dar explicaciones. Pensemos, por ejemplo, en la definición de 
área de una superficie. Muchos libros se limitan a definirla mediante una 
fórmula en términos de expresiones coordenadas, sin más justificación que 
la demostración de su consistencia (de que no depende del sistema de 
coordenadas elegido). Otros aceptan como "motivación" el teorema de 
cambio de variables, considerando que es natural tomar como definición 
de cambio de variables entre un abierto de IR™ y un abierto en una variedad 
lo que entre dos abiertos de K™ es un teorema nada trivial. No podemos 
resumir nuestro enfoque en pocas líneas, pero invitamos al lector a que 
preste atención a la justificación de éste y muchos otros conceptos. 

• Mostrar la fundamentación del cálculo infinitesimal clásico, en lugar de 
sustituirlo por otro cálculo moderno mucho más rígido y abstracto. Por 
ejemplo, a la hora de desarrollar una teoría de integración potente es 
imprescindible introducir la teoría de la medida abstracta y sus resultados 
más importantes. A ello dedicamos los capítulos VII y VIII, pero tras 
ello, en el capítulo siguiente, envolvemos toda esta teoría abstracta en 
otra mucho más elástica y natural, la teoría de formas diferenciales, que 
requiere a la anterior como fundamento, pero que termina por ocultarla, 
de modo que a partir de cierto punto es muy rara la ocasión en que se 
hace necesario trabajar explícitamente con las medidas y sus propiedades. 



• Mostrar la aplicación y la utilidad de los resultados teóricos que presen- 
tamos. Las primeras aplicaciones tienen que ver con la geometría, pero 
paulatinamente van siendo desplazadas por aplicaciones a la física. En 
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la medida de lo posible hemos evitado presentar las aplicaciones como 
animales enjaulados en un zoológico, es decir, desvinculadas de sus con- 
textos naturales, de manera que den mas la impresión de anécdotas que 
de verdaderos éxitos del cálculo infinitesimal. En el caso de la física va- 
mos introduciendo los conceptos fundamentales (velocidad, aceleración, 
fuerza, energía, etc.) según van siendo necesarios, de modo que de estas 
páginas podría extraerse una sucinta introducción a la física. En lo to- 
cante a la geometría, por los motivos explicados en el segundo punto nos 
hemos restringido a trabajar con subvariedades de R n , es decir, hemos evi- 
tado la definición abstracta de variedad para tener así una interpretación 
natural de los espacios tangentes y su relación con la variedad. En algu- 
nos ejemplos concretos necesitamos que el lector esté familiarizado con la 
geometría proyectiva, la teoría de las secciones cónicas y otros puntos de 
la geometría pre-diferencial. Los hemos marcado con un asterisco. Nin- 
guno de estos ejemplos es necesario para seguir el resto del libro. Uno de 
ellos, el del plano proyectivo, lo usamos de forma no rigurosa para ilustrar 
la necesidad de una definición más general de variedad, mostrando que 
muchos de los conceptos que definimos para una subvariedad de R 3 son 
aplicables formalmente al caso del plano proyectivo, si bien la teoría de 
que disponemos no nos permite justificar esta aplicación. 

De los puntos anteriores no debe leerse entre líneas una cierta aversión hacia 
el análisis abstracto. Al contrario, creemos que este libro puede ser continuado 
de forma natural en muchas direcciones: la teoría espectral, la teoría de distri- 
buciones, el análisis de Fourier, el cálculo variacional, la teoría de funciones de 
variable compleja, la geometría diferencial y la topología general. 

Por citar algunos ejemplos, nosotros probamos que el problema de Dirichlet 
tiene solución en una familia muy amplia de abiertos para unas condiciones de 
frontera dadas, pero la resolución explícita en casos concretos requiere de la 
transformada de Fourier, que en general se aplica a muchas otras ecuaciones 
en derivadas parciales. Por otra parte, la transformada de Fourier permite des- 
componer una onda en su espectro continuo de frecuencias. Cuando se estudia 
la solución de la ecuación de ondas en abiertos distintos de todo R 3 aparecen 
las ondas estacionarias, que llevan al análisis espectral y, en casos particulares, 
a la teoría de series de Fourier o de las funciones de Bessel entre otras. Los 
problemas de gravitación o electromagnetismo que involucran masas y cargas 
puntuales o corrientes eléctricas unidimensionales pueden unificarse con los pro- 
blemas que suponen distribuciones continuas de masas, cargas y corrientes a 
través de la teoría de distribuciones. 

Tampoco nos gustaría que las comparaciones que hemos hecho con otros 
libros se interpreten a modo de crítica. Tan sólo queremos hacer hincapié en que 
nuestros objetivos son distintos a los de muchos otros libros. Somos conscientes 
de que nuestro propósito de justificar las definiciones más allá de una motivación 
más o menos dudosa nos ha llevado a seguir caminos mucho más profundos y 
laboriosos que los habituales, por lo que, a pesar de su carácter autocontenido 
en lo tocante a topología y análisis, es muy difícil que este libro sea de utilidad 
a un lector que no cuente ya con una cierta familiaridad con la materia. Por ello 
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es obvio que un libro cuya finalidad principal sea didáctica, o bien que quiera 
profundizar más que nosotros en física o geometría diferencial, deberá pasar por 
alto muchas sutilezas en las que nosotros nos hemos detenido. 

Comentamos, para terminar, que al lector se le supone únicamente unos cier- 
tos conocimientos de álgebra, especialmente de álgebra lineal, y algunas nociones 
elementales de geometría (salvo para los ejemplos marcados con un asterisco). 
Esporádicamente serán necesarios conocimientos más profundos, como para la 
prueba de la trascendencia de e y n, sobre todo en la de ir, o al estudiar el 
concepto de orientación, donde para interpretar el signo del determinante de 
una biyección afín usamos que el grupo especial lineal de IR™ está generado por 
las transvecciones. Ninguno de estos hechos se necesita después. 



Capítulo I 

Topología 



La topología puede considerarse como la forma más abstracta de la geo- 
metría. El concepto principal que puede definirse a partir de la estructura 
topológica es el de aplicación continua, que viene a ser una transformación rea- 
lizada sin cortes o saltos bruscos o, dicho de otro modo, que transforma puntos 
próximos en puntos próximos. Los resultados topológicos son aplicables tanto a 
la geometría propiamente dicha como a la descripción de otros muchos objetos 
más cercanos a la teoría de conjuntos general, si bien aquí nos centraremos en 
la vertiente geométrica. Al combinarla con el álgebra obtendremos el cálculo 
diferencial, que constituye la herramienta más potente para el estudio de la 
geometría. 

1.1 Espacios topológicos 

Según acabamos de comentar, una aplicación continua es una aplicación que 
transforma puntos próximos en puntos próximos. Nuestro objetivo ahora es 
definir una estructura matemática en la que esta afirmación pueda convertirse 
en una definición rigurosa. En primer lugar conviene reformularla así: una apli- 
cación continua es una aplicación que transforma los puntos de alrededor de un 
punto dado en puntos de alrededor de su imagen. En efecto, si cortamos una cir- 
cunferencia por un punto P para convertirla en un segmento, la transformación 
no es continua, pues los puntos de alrededor de P se transforman unos en los 
puntos de un extremo del segmento y otros en los puntos del otro extremo, luego 
no quedan todos alrededor del mismo punto. En cambio, podemos transformar 
continuamente (aunque no biyectivamente) una circunferencia en un segmento 
sin más que aplastarla. 
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Una forma de dar rigor al concepto de "puntos de alrededor" de un punto 
dado es a través de una distancia. Veremos que no es lo suficientemente general, 
pero sí muy representativa. La formalización algebraica de la geometría euclídea 
se lleva a cabo a través de IR™. Su estructura vectorial permite definir los puntos, 
rectas, planos, etc. y a ésta hay que añadirle la estructura métrica derivada del 
producto escalar: 



A partir de él se definen los dos conceptos fundamentales de la geometría 
métrica: la longitud de un vector y el ángulo entre dos vectores. En efecto, la 
longitud de un vector es la norma 
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y el ángulo a que forman dos vectores no nulos x, y viene dado por 

xy 

cosa= ¥ÍH\' 

Estas estructuras son demasiado particulares y restrictivas desde el punto 
de vista topológico. La medida de ángulos es un sinsentido en topología, y la de 
longitudes tiene un interés secundario, pues no importan las medidas concretas 
sino tan sólo la noción de proximidad. En primer lugar generalizaremos el 
concepto de producto escalar para admitir como tal a cualquier aplicación que 
cumpla unas mínimas propiedades: 

Definición 1.1 Usaremos la letra K para referirnos indistintamente al cuerpo 
IR de los números reales o al cuerpo C de los números complejos. Si a G K, 
la notación á representará al conjugado de a si K = C o simplemente a = a 
si K = IR. Si H es un K-espacio vectorial, un producto escalar en H es una 
aplicación • : H x H — > K que cumple las propiedades siguientes: 

a) x ■ y = y^x, 

b) (x + y) ■ z = x ■ z + y ■ z, 

c) (ra) • y = a(x ■ y), 

d) a;-x>0yx-a; = 0siy sólo si x = 0, 
para todo x, y, z G H y todo a G K. 

Notar que a) y b) implican también la propiedad distributiva por la derecha: 
x ■ (y + z) = x ■ y + x ■ z. 

Un espacio prehilbertiano es un par (H, •), donde H es un K-espacio vectorial 
y • es un producto escalar en H. En la práctica escribiremos simplemente H en 
lugar de (H, •). 

Si H es un espacio prehilbertiano, definimos su norma asociada como la 
aplicación || || : H — > E dada por ||x|| = y/x ■ x. 
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Ejemplo Un producto escalar en el espacio K n viene dado por 

x-y = x 1 y 1 -\ \-x n y n . 

De este modo, = ^/|xi| 2 + • • • + \x n \ 2 . ■ 

Teorema 1.2 Sea H un espacio prehilbertiano y sean x, y € H. Entonces 

a) (desigualdad de Schwarz) \x ■ y\ < ||x||||y||. 

b) (desigualdad triangular) \\x + y\\ < \\x\\ + \\y\\. 

DEMOSTRACIÓN: a) Sean A = \\x\\ 2 , B = \x ■ y\ y C = ||y|| 2 . Existe un 
número complejo a tal que \a\ = 1 y a(y ■ x) = B. Para todo número real r se 
cumple 

0 < (x — ray) ■ (x — ray) = x ■ x — ra(y ■ x) — rá(x ■ y) + r 2 y ■ y. 

Notar que á(x ■ y) = B = B, luego A - 2Br + Cr 2 > 0. Si C = 0 ha de 
ser B = 0, o de lo contrario la desigualdad sería falsa para r grande. Si C > 0 
tomamos r — B/C y obtenemos B 2 < AC. 

b) Por el apartado anterior: 

ll^ + yll 2 = (x + y)-(x + y)=x-x + x-y + y-x + y-y 
< || 2; || 2 + 2||x|||| y || + || y || 2 = (¡| a; || + ||y||) 2 . 

Notar que x ■ y + y ■ x es un número real, luego 

x-y + yx< \x-y + yx\ < \x-y\ + \yx\. 



La norma permite definir una distancia entre puntos con la que formalizar 
el concepto de proximidad que nos interesa, pero para ello no es necesario que 
la norma provenga de un producto escalar. Conviene aislar las propiedades de 
la norma que realmente nos hacen falta para admitir como tales a otras muchas 
aplicaciones: 

Definición 1.3 Si E es un espacio vectorial sobre K, una norma en E es una 
aplicación || || : E — > [0, +oo[ que cumpla las propiedades siguientes: 

a) ||v|| = 0 si y sólo si v = 0. 

b) || V + HI<IHI + IHI- 

c) \\av\\ = \a\ \\v\\, 

para v, w € E y todo «el. 
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Un espacio normado es un par (E, || ||) en estas condiciones. En la práctica 
escribiremos E, sin indicar explícitamente la norma. 

Es inmediato comprobar que la norma de un espacio prehilbertiano es una 
norma en el sentido general de la definición anterior. En particular K" es un 
espacio normado con la norma del ejemplo anterior, que recibe el nombre de 
norma euclídea. El teorema siguiente nos da otras dos normas alternativas. La 
prueba es elemental. 

Teorema 1.4 K™ es un espacio normado con cualquiera de estas normas: 

■ máx{|a;¿| | i 



Nli = ¿ 



Xi\, \\x\\ 2 



=i 



,En 2 ' ii^ii 
\ i=i 



l,...,n}. 



Notar que para n = 1 las tres normas coinciden con el valor absoluto. El 
hecho de que estas tres aplicaciones sean normas permite obtener un resultado 
más general: 

Teorema 1.5 Sean E\, . . . , E n espacios normados. Entonces las aplicaciones 
siguientes son normas en E = E\ x • • • x E n . 



mu 



E 

»=i 



* 2 



x En^ii 2 ' 
\ i=i 



max \\Xi 



l,...,n}. 



Además se cumplen las relaciones: ||x||oo < ||a;||2 < llalli < ^H^H 



Demostración: Tenemos ||ir|| ¿ = ||(||a;i||, . . . , ||a;„||)|| ¿ para i = l,2,oo. 
Usando el teorema anterior se ve inmediatamente que son normas. 



* En^ii 2 = ii^i' 2 - 
\ i= i 



Slk,P + 2^||x ( |lb,l 

i<j 



i=l 



= MI.<El 



X QQ — Ti X 



Notemos también que las normas del teorema 1.4 coinciden con las construi- 
das mediante este último teorema a partir del valor absoluto en K. 

Ejercicio: Probar que en un espacio normado se cumple | ||x|| — ||y||| < ||x — y\. 

Como ya hemos comentado, desde un punto de vista topológico el único 
interés de las normas es que permiten definir la distancia entre dos puntos como 
d(x,y) = \\x — y\\. Sin embargo, a efectos topológicos no es necesario que una 
distancia esté definida de este modo. 
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Definición 1.6 Una distancia o métrica en un conjunto M es una aplicación 
d : M x M — > [0, +oo[ que cumpla las propiedades siguientes 

a) y) = 0 si y sólo si x = y, 

b) d(x,y) = d(y,x), 

c) d(x,z) < d(x,y) + d(y,z), 
para todos los x, y, z € M. 

Un espacio métrico es un par (M, d) donde M es un conjunto y d una dis- 
tancia en M. Como en el caso de espacios normados escribiremos M en lugar 
de(M,d). 

Todo espacio normado i? es un espacio métrico con la distancia definida 
por d(x,y) = \\x — y\\. Las propiedades de la definición de norma implican 
inmediatamente las de la definición de distancia. En particular en K™ tenemos 
definidas tres distancias: 



di(x,y) = ^2\xi-yi\, d 2 (x,y) = 



i=l 



\ i= i 



doo(x,y) = máxjl^ - y¿| | 1 < i < ra}. 

Más en general, estas fórmulas permiten definir distancias en cualquier pro- 
ducto finito de espacios métricos. La prueba del teorema siguiente es muy 
sencilla a partir de los teoremas 1.4 y 1.5. 

Teorema 1.7 Sean M\, . . . , M n espacios métricos. Sea M = Mi x • • • x M n . 

Entonces las aplicaciones d\, d 2 , doo : MxM — > [0, +oo[ definidas como sigue 
son distancias en M: 



<k(x,y) 
doo(x,y) 



i=i 



^2d{x tl yi) 2 , 
\ ¿=i 

máx{d(xi, yi) \ 1 < i < ra}. 



Además se cumplen las relaciones d OD (x,y) < d 2 (x 7 y) < di(x,y) < nd OD (x,y). 

Definición 1.8 Sea M un espacio métrico, x € M y e > 0 (en estos casos 
sobreentenderemos egl). Definimos 

B e (x) = {y € M | d(x,y) < e} (Bola abierta de centro x y radio e). 
B' e (x) = {y € M | d(x,y) < e} (Bola cerrada de centro x y radio e). 
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La figura muestra las bolas de centro (0, 0) y radio 1 para las tres métricas 
que hemos definido en IR 2 . 




Las bolas con otros centros son trasladadas de éstas, y las bolas de otros 
radios son homotéticas. Las bolas abiertas se diferencian de las cerradas en que 
las primeras no contienen los puntos del borde. El interés de las bolas reside 
en que una bola de centro un punto P contiene todos los puntos de alrededor 
de P, por pequeño que sea su radio. Observar que el concepto de "puntos de 
alrededor" es un tanto escurridizo: Según lo que acabamos de decir, ningún 
punto en particular (distinto de P) está alrededor de P, pues siempre podemos 
tomar una bola suficientemente pequeña como para que deje fuera a dicho punto. 
Esto significa que no podemos dar sentido a la afirmación "Q es un punto de 
alrededor de P", pero lo importante es que sí tiene sentido decir "El conjunto A 
contiene a todos los puntos de alrededor de P" . Esto sucede cuando A contiene 
una bola cualquiera de centro P, y entonces diremos que A es un entorno de P. 
Aunque el concepto de entorno podría tomarse como concepto topológico básico, 
lo cierto es que es más cómodo partir de un concepto "más regular": diremos 
que un conjunto es abierto si es un entorno de todos sus puntos. Los conjuntos 
abiertos tienen las propiedades que recoge la definición siguiente: 

Definición 1.9 Una topología en un conjunto X es una familia 7 de subconjun- 
tos de X a cuyos elementos llamaremos abiertos, tal que cumpla las propiedades 
siguientes: 

a) 0 y X son abiertos. 

b) La unión de cualquier familia de abiertos es un abierto. 

c) La intersección de dos abiertos es un abierto. 

Un espacio topológico es un par (X, 7), donde X es un conjunto y T es una 
topología en X. En la práctica escribiremos simplemente X en lugar de (X, 7). 

Sea M un espacio métrico. Diremos que un conjunto GcMes abierto si 
para todo x € G existe un e > 0 tal que B e (x) C G. Es inmediato comprobar 
que los conjuntos abiertos así definidos forman una topología en M, a la que 
llamaremos topología inducida por la métrica. En lo sucesivo consideraremos 
siempre a los espacios métricos como espacios topológicos con esta topología. 

En el párrafo previo a la definición de topología hemos definido "abierto" 
como un conjunto que es entorno de todos sus puntos. Puesto que formalmente 
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hemos definido los espacios topológicos a partir del concepto de abierto, ahora 
hemos de definir el concepto de entorno. 

Si X es un espacio topológico, U C X y x € U, diremos que U es un entorno 
de x si existe un abierto G tal que x € G C U. 

Es inmediato comprobar que, en un espacio métrico, U es entorno de x si 
y sólo si existe un e > 0 tal que B e (x) C U, es decir, si y sólo si U contiene a 
todos los puntos de alrededor de x, tal y como habíamos afirmado. 

Ejemplo El intervalo / = [0, 1], visto como subconjunto de IR, es entorno de 
todos sus puntos excepto de sus extremos 0 y 1, pues si 0 < x < 1 siempre 
podemos tomar e = mín{x, 1 — x} y entonces B e (x) = ]x — e, x + e[ C I. En 
cambio, / no contiene todos los puntos de alrededor de 1, pues toda bola de 
centro 1 contiene puntos a la derecha de 1 y ninguno de ellos está en /. El caso 
del 0 es similar. En particular I no es abierto. ■ 

El teorema siguiente recoge las propiedades básicas de los entornos. La 
prueba es inmediata. 

Teorema 1.10 Sea X un espacio topológico, x e X y E x la familia de todos 
los entornos de x. 

a) Un conjunto G C X es abierto si y sólo si es un entorno de todos sus puntos. 
bl) X e E x . 

b2) SiUeE x yUcVcX entonces V G E x . 
b3) Si U, V £ E x entonces UC\V £ E x . 

Puesto que los abiertos pueden definirse a partir de los entornos, es obvio que 
si dos topologías sobre un mismo conjunto tienen los mismos entornos entonces 
son iguales. Las desigualdades del teorema 1.7 implican que una bola para 
una de las tres distancias definidas en el producto M contiene otra bola del 
mismo centro para cualquiera de las otras distancias. De aquí se sigue que 
un subconjunto de M es entorno de un punto para una distancia si y sólo 
si lo es para las demás, y de aquí a su vez que las tres distancias definen la 
misma topología en el producto. En particular, las tres distancias que tenemos 
definidas sobre K™ definen la misma topología, a la que llamaremos topología 
usual o topología euclídea en K™. 

Esta es una primera muestra del carácter auxiliar de las distancias en topo- 
logía. Cuando queramos probar un resultado puramente topológico sobre W l 
podremos apoyarnos en la distancia que resulte más conveniente, sin que ello su- 
ponga una pérdida de generalidad. La distancia d 2 es la distancia euclídea y por 
lo tanto la más natural desde un punto de vista geométrico, pero las distancias 
di y d oo son formalmente más sencillas y a menudo resultan más adecuadas. 
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Ejemplo Es fácil definir una distancia en K™ que induzca una topología dis- 
tinta de la usual. De hecho, si X es un conjunto cualquiera podemos considerar 
la distancia d : X x X — > R dada por 



Es fácil ver que efectivamente es una distancia y para todo punto x se cumple 
que B\(x) — {x}, luego {x} es un entorno de x, luego es un abierto y, como 
toda unión de abiertos es abierta, de hecho todo subconjunto de X es abierto. 
La métrica d recibe el nombre de métrica discreta y la topología que induce es 
la topología discreta. Un espacio topológico cuya topología sea la discreta es un 
espacio discreto. 

En un espacio discreto un punto no tiene más punto a su alrededor que él 
mismo. Esta topología es la más adecuada para conjuntos como N o Z, pues, 
efectivamente, un número entero no tiene alrededor a ningún otro. ■ 

Las bolas abiertas de un espacio métrico son abiertas. Esto es fácil de ver 
intuitivamente, pero el mero hecho de que las hayamos llamado así no justifica 
que lo sean: 

Teorema 1.11 Las bolas abiertas de un espacio métrico son conjuntos abiertos. 

Demostración: Sea B e (x) una bola abierta y sea y G B e (x). Entonces 
d(x,y) < e. Sea 0 < S < e — d(x,y). Basta probar que B¿(y) C B e (x). Ahora 
bien, si z G B$(y), entonces d(z, x) < d(z 7 y) + d(y,x) < 5 + d(x,y) < e, luego 
en efecto z £ B € (x). m 

1.2 Bases y subbases 

Hemos visto que la topología en un espacio métrico se define a partir de las 
bolas abiertas. El concepto de "bola abierta" no tiene sentido en un espacio 
topológico arbitrario en el que no tengamos dada una distancia, sin embargo 
hay otras familias de conjuntos que pueden representar un papel similar. 

Definición 1.12 Sea X un espacio topológico. Diremos que una familia CB de 
abiertos de X (a los que llamaremos abiertos básicos) es una base de X si para 
todo abierto G de X y todo punto x € G existe un abierto B € H tal que 
x e B c G. 

Si x G X diremos que una familia E de entornos (abiertos) de x (a los que 
llamaremos entornos básicos de x) es una base de entornos (abiertos) de x si 
todo entorno de x contiene un elemento de E. 

En estos términos la propia definición de los abiertos métricos (junto con el 
hecho de que las bolas abiertas son realmente conjuntos abiertos) prueba que 
las bolas abiertas son una base de la topología métrica, y también es claro que 
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las bolas abiertas de centro un punto x forman una base de entornos abiertos 
de x. Pero estos conceptos son mucho más generales. Pensemos por ejemplo que 
otras bases de un espacio métrico son las bolas abiertas de radio menor que 1, las 
bolas abiertas de radio racional, etc. Cualquier base determina completamente 
la topología y en cada ocasión puede convenir trabajar con una base distinta. 

Teorema 1.13 Sea X un espacio topológico. 

a) Una familia de abiertos 53 es una base de X si y sólo si todo abierto de X 
es unión de abiertos de 53. 

b) Si 53 es una base de X y x £ X entonces "B x = {B £ 13 | x £ B} es una 
base de entornos abiertos de X. 

c) Si para cada punto x £ X el conjunto E x es una base de entornos abiertos 

de x entonces 53 = \J E x es una base de X. 

xex 

Demostración: a) Si 23 es una base de X y G es un abierto es claro que 
G es la unión de todos los abiertos de 53 contenidos en G, pues una inclusión es 
obvia y si x £ G existe un B £ 53 tal que x £ B C G, luego x está en la unión 
considerada. El recíproco es obvio. 

b) Los elementos de 53^ son obviamente entornos de x y si U es un entorno 
de x entonces existe un abierto G tal que x £ G CU, y a su vez existe B £ 53 
tal que x £ B C G, luego B £ 53a, y B C U. Esto prueba que 53^ es una base 
de entornos abiertos de x. 

c) Si G es un abierto de X y x £ G, entonces G es un entorno de x, luego 
existe un entorno básico B £ E x tal que x £ B C G y ciertamente i? £ 53. Como 
además los elementos de 53 son abiertos, tenemos que 53 es una base de X. ■ 

Una forma habitual de definir una topología en un conjunto es especificar una 
base o una base de entornos abiertos de cada punto. Por ejemplo, la topología 
métrica puede definirse como la topología que tiene por base a las bolas abiertas 
o como base de entornos de cada punto x a las bolas abiertas de centro x. No 
obstante, para que una familia de conjuntos pueda ser base de una topología 
ha de cumplir unas propiedades muy simples que es necesario comprobar. El 
teorema siguiente da cuenta de ellas. 

Teorema 1.14 Sea X un conjunto y 53 una familia de subconjuntos de X que 
cumpla las propiedades siguientes: 

a) X= U B, 

se® 

b) SiU , V £53 y x eU T\V entonces existe W £ 53 tal que x £ W C U H V. 
Entonces existe una única topología en X para la cual 53 es una base. 

Demostración: Definimos los abiertos de X como las uniones de elementos 
de 53. Basta comprobar que estos abiertos forman realmente una topología, pues 
ciertamente en tal caso 53 será una base y la topología será única. 
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El conjunto vacío es abierto trivialmente (o si se prefiere, por definición). El 
conjunto X es abierto por la propiedad a). 

La unión de abiertos es obviamente abierta (una unión de uniones de ele- 
mentos de 23 es al fin y al cabo una unión de elementos de 23). 

Sean Gi y Gi abiertos y supongamos que x £ GiC\G-2- Como Gi es unión de 
elementos de 23 existe un [/ € 23 tal que x £ U C G\. Similarmente x £ V C G 2 
con V £ 23. Por la propiedad b) existe W £ 23 tal que x £ W C Uf\V C GiHG 2 . 
Así pues, x está en la unión de los conjuntos W £ 23 tales que W C G\ n G 2 , y 
la otra inclusión es obvia, luego Gi n G 2 es unión de elementos de 23. ■ 

El teorema siguiente nos da las condiciones que hemos de comprobar para 
definir una topología a partir de una familia de bases de entornos abiertos. 

Teorema 1.15 Sea X un conjunto y para cada x £ X sea "B x una familia no 
vacia de subconjuntos de X tal que: 

a) Si U £ H x , entonces x £ U . 

b) SiU,V £ 23 x , existe un W G 23 x tal queWcUDV. 

c) Si x £ U £ "By, existe un V € 23 x tal que V C U. 

Entonces existe una única topología para la cual cada 23^ es una base de entornos 
abiertos de x. 

Demostración: Sea 23 = 1J 23^. Veamos que 23 cumple las condiciones 

xex 

del teorema anterior para ser base de una topología en X. Por la condición a) 
tenemos que X = \J B. 

Si U, V £ 23 y x £ U n V, entonces U £ H y y V £ H z para ciertos y, z. 
Existen U' , V £ Ti x tales que U' C U y V C V (por la condición c). Existe 
W £'í> x tal que W C U' H V (por la condición b). Así x £ W C U H V con 
W £ 23. 

Por lo tanto 23 es la base de una topología en X para la que los elementos 
de cada 23^, son abiertos y, en particular, entornos de a;. Si A es un entorno de x 
para dicha topología, existe un U £ 23 tal que x £ U £ A. Por definición de 23, 
existe un y £ X tal que U £ "B y , y por c) existe un V £ 23 x tal que V C U £ A. 
Esto prueba que 23^ es una base de entornos de x. 

Las bases de entornos determinan los entornos y por tanto la topología, es 
decir, se da la unicidad. ■ 

Ejemplo Como aplicación de este teorema vamos a convertir en espacio to- 
pológico al conjunto IR = R U {—00, +00}. Para ello definimos como base de 
entornos abiertos de cada número real x al conjunto los entornos abiertos de x 
en R con la topología usual, la base de entornos abiertos de +00 está formada 
por los intervalos ]íc, +00], donde x varía en E, y la base de entornos abiertos 
de —00 la forman los intervalos [—00, x[, donde x varía en R. Con esto estamos 
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diciendo que un conjunto contiene a los alrededores de +00 si contiene a todos 
los números reales a partir de uno dado, y análogamente para —00. 

Es fácil comprobar que las familias consideradas cumplen las propiedades 
del teorema anterior, luego definen una topología en IR. 

Teniendo en cuenta que hemos definido los entornos abiertos de los números 
reales como los entornos abiertos que ya tienen en la topología usual, es inme- 
diato que un subconjunto de IR es abierto en la topología usual de IR si y sólo si 
lo es en la topología que hemos definido en IR. ■ 

Hay un concepto análogo a los de base y base de entornos que es menos 
intuitivo, pero mucho más práctico a la hora de definir topologías. Se trata del 
concepto de subbase: 

Definición 1.16 Sea X un espacio topológico. Una familia de abiertos S es 
una subbase de X si las intersecciones finitas de elementos de S forman una base 
de X. 

Por ejemplo, es fácil ver que los intervalos abiertos ]a, b[ forman una base de 
IR (son las bolas abiertas). Por consiguiente, los intervalos de la forma ]— 00, a[ 
y ]a, +oo[ forman una subbase de IR, pues son abiertos y entre sus interseccio- 
nes finitas se encuentran todos los intervalos ]a, b[ (notar además que cualquier 
familia de abiertos que contenga a una base es una base). 

La ventaja de las subbases consiste en que una familia no ha de cumplir 
ninguna propiedad en especial para ser subbase de una topología: 

Teorema 1.17 Sea X un conjunto y S una familia de subconjuntos de X. 
Entonces existe una única topología en X de la cual S es subbase. 

Demostración: Sea 23 la familia de las intersecciones finitas de elementos 
de S. Entonces X = f] G € 23 y obviamente la intersección de dos intersec- 

ciones finitas de elementos de S es una intersección finita de elementos de S; 
luego si U, V € 23 también U H V € 23, de donde se sigue que 53 es la base de 
una topología en X, de la cual S es subbase. Claramente es única, pues 23 es 
base de cualquier topología de la que S sea subbase. ■ 



1.3 Productos y subespacios 

Hemos visto que el producto de una familia finita de espacios métricos es 
de nuevo un espacio métrico de forma natural (o mejor dicho, de tres formas 
distintas pero equivalentes desde un punto de vista topológico) . Ahora veremos 
que la topología del producto se puede definir directamente a partir de las 
topologías de los factores sin necesidad de considerar las distancias. Más aún, 
podemos definir el producto de cualquier familia de espacios topológicos, no 
necesariamente finita. 
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Definición 1.18 Sean {Xi} ie j espacios topológicos. Consideremos su pro- 
ducto cartesiano X = Yí Y l as proyecciones pi : X — > Xi que asignan 
iei 

a cada punto su coordenada ¿-ésima. Llamaremos topología producto en X a la 
que tiene por subbase a los conjuntos p~ 1 [G], donde i € I y G es abierto en X¿. 

Una base de la topología producto la forman los conjuntos de la forma 
P| p^ 1 [G¿], donde F es un subconjunto finito de I y G¿ es abierto en JQ. 

¿GF 

Equivalentemente, la base está formada por los conjuntos f\ Gu donde cada 

iei 

Gi es abierto en I¡ y G, = Xi salvo para un número finito de índices. Al 

conjunto de estos índices se le llama soporte del abierto básico T\ Gi. 

iei 

Si el número de factores es finito la restricción se vuelve vacía, de modo que 
un abierto básico en un producto X\ x • • • x X n es simplemente un conjunto de 
la forma Gi x • • • x G n , donde cada G¿ es abierto en X¿. 

En lo sucesivo "casi todo i" querrá decir "todo índice i salvo un número 
finito de ellos" . 

Teorema 1.19 Sean {Xi} ie j espacios topológicos, para cada i sea Hi una base 
de Xi. Entonces los conjuntos de la forma Y[ Gi, donde cada Gi está en 53¿ o 

es Xi (y casi todos son Xi) forman una base de T\ Xi. 

iei 

DEMOSTRACIÓN: Consideremos la topología T en el producto que tiene 
por subbase a los conjuntos p" 1 ^] con G¿ en 23, (y, por consiguiente, tieen 
por base a los abiertos del enunciado). Como ciertamente estos conjuntos son 
abiertos para la topología producto, tenemos que todo abierto de T lo es de 
la topología producto. Recíprocamente, un abierto subbásico de la topología 

producto es p~ l [Gi], con G¿ abierto en X¿. Entonces G¿ = (J B, donde cada 

BeAi 

Ai es un subconjunto de 53¿. Por lo tanto p~ 1 [G¿] = (J p^ 1 [_B] es abierto 

BeAi 

de T. Por consiguiente todo abierto de la topología producto lo es de T y así 
ambas topologías coinciden. ■ 

En lo sucesivo, a pesar de que en el producto se puedan considerar otras 
bases, cuando digamos "abiertos básicos" nos referiremos a los abiertos indicados 
en el teorema anterior tomando como bases de los factores las propias topologías 
salvo que se esté considerando alguna base en concreto. 

Tal y como anunciábamos, el producto de espacios topológicos generaliza al 
producto de espacios métricos (o de espacios normados) . El teorema siguiente 
lo prueba. 

Teorema 1.20 Si M\, . . . , M n son espacios métricos, entonces la topología in- 
ducida por las métricas de 1.7 en M = M\ x • • • x M n es la topología producto. 

Demostración: Como las tres métricas inducen la misma topología sólo 
es necesario considerar una de ellas, pero para la métrica dao se cumple B e (x) = 
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B e (xi)x- ■ -xB £ (x n ), luego la base inducida por la métrica es base de la topología 
producto. ■ 

La definición de topología producto es sin duda razonable para un número 
finito de factores. Sin embargo cuando tenemos infinitos factores hemos exigido 
una condición de finitud que no hemos justificado. En principio podríamos 

considerar en Yl A¿ la topología que tiene por base a los productos Yl Gi con Gi 

iei iei 
abierto en A¿ (sin ninguna restricción de finitud). Ciertamente estos conjuntos 
son base de una topología a la que se le llama topología de cajas, y el teorema 
siguiente muestra que no coincide con la topología producto que hemos definido. 
La topología producto resulta ser mucho más útil que la topología de cajas. 

Teorema 1.21 Sea {X¿}¿ e j una familia de espacios topológicos. Los únicos 

abiertos en Yl -X¿ de la forma Yl Gi ^ 0 son los abiertos básicos, es decir, los 

iei iei 
que además cumplen que cada Gi es abierto y G¿ = X¿ para casi todo i. 

DEMOSTRACIÓN: Supongamos que Yl Gi es un abierto no vacío. Con- 

iei 

sideremos un punto x G Yl Gi- Existirá un abierto básico Yl H% tal que 

íei iei 
x G Yl Hi C n Gi, luego para cada índice i se cumplirá x¿ G í/¿ C G¿, y como 
iei iei 

casi todo Hi es igual a A¿, tenemos que G¿ = X¿ para casi todo i. Además tene- 
mos que Gi es un entorno de x¿, pero dado cualquier elemento a G G¿ siempre 

podemos formar un x G Yl Gi tal que x¿ — a, luego en realidad tenemos que G¿ 
te/ 

es un entorno de todos sus puntos, o sea, es abierto. ■ 

Nos ocupamos ahora de los subespacios de un espacio topológico. Es evidente 
que todo subconjunto N de un espacio métrico M es también un espacio métrico 
con la misma distancia restringida a N x N. Por lo tanto tenemos una topología 
en M y otra en N. Vamos a ver que podemos obtener la topología de N 
directamente a partir de la de M, sin pasar por la métrica. 

Teorema 1.22 Sea X un espacio topológico (con topología 7) y A C X. De- 
finimos 7a = {G n A | G G 7}. Entonces 7a es una topología en A llamada 
topología relativa a X (o topología inducida por X) en A. En lo sucesivo so- 
breentenderemos siempre que la topología de un subconjunto de un espacio X es 
la topología relativa. 

Demostración: A = X n A e 7 A , 0 = 0 n A e 7 A - 

Sea G C T A . Para cada G G G sea U G = {U G T | U n A = G} ± 0 y sea 
Vq la unión de todos los abiertos de Uq. 

De este modo Va es un abierto en X y Va f~l A = G. 

U G = |J V G n A, y (J V G G 7, luego G G 7 A . 

cec Gec Gec 

Si U, V G 7 A , U = U' n A y V = V n A con U', V G T. Entonces 
U n V = U' n V n A G 7 a , pues C/' n V G T. Así Ta es una topología en A. 
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Ejemplo Consideremos I = [0, 1] C K. Resulta que ]l/2, 1] es abierto en /, 
pues ]l/2, 1] = ]l/2,2[n/ y ]l/2,2[ es abierto en R. Sin embargo ]l/2, 1] no es 
abierto en R porque no es entorno de 1. Intuitivamente, ]l/2, 1] no contiene a 
todos los puntos de alrededor de 1 en IR (faltan los que están a la derecha de 1), 
pero sí contiene a todos los puntos de alrededor de 1 en 7. ■ 

La relación entre espacios y subespacios viene perfilada por los teoremas 
siguientes. El primero garantiza que la topología relativa no depende del espacio 
desde el que relativicemos. 

Teorema 1.23 Si X es un espacio topológico (con topología 7) y A C B C X, 
entonces 7 A = (7b) a- 

Demostración: Si U es abierto en Ta, entonces U = V n A con V e 7, 
luego VC\Be7 B yU = VC\A = (VC\B)C\Ae (7 b )a- 

Si U e (7 B ) a, entonces U = V H A con V € 7 B , luego V = W n B con 
W £ 7. Así pues, U = W n B n A = W n A e 7 A . Por lo tanto 7 A = (7 B ) A . 



Teorema 1.24 Si CB es una base de un espacio X y A C X , entonces el con- 
junto {B n A I B e 23} es «na 6ase de A. 

DEMOSTRACIÓN: Sea U un abierto en A y x e U. Existe un V abierto 
en X tal que U = V H A. Existe un B € CB tal que x € B C V", luego 
ie5flAcl / nA=[/. Por lo tanto la familia referida es base de A. ■ 

Similarmente se demuestra: 

Teorema 1.25 Si H x es una base de entornos (abiertos) de un punto x de un 
espacio X y x € A C X , entonces {B n A \ Be H x } es una base de entornos 
(abiertos) de x en A. 

Teorema 1.26 Sea M un espacio métrico y sea A C M. Entonces d! = d\ A xA 
es una distancia en A y la topología que induce es la topología relativa. 

Demostración: Una base para la topología inducida por la métrica de A 
sería la formada por las bolas 

Bf(x) = {a e A | d'(x,a) < e} = {a € X | d(x,a) < e} H A = Bf(x) n A, 

pero éstas son una base para la topología relativa por el teorema 1.24. ■ 

Teorema 1.27 Sea {X¿}¿ 6 / una familia de espacios topológicos y para cada i 

sea Yi C X¿. Entonces la topología inducida en Y[ Yi P or Tí es la misma 

íei iei 

que la topología producto de los {Y¿}¿ £ /. 

(La base obtenida por el teorema 1.24 a partir de la base usual de la topología 
producto es claramente la base usual de la topología producto.) 

Ejercicio: Probar que la topología que hemos definido en R induce en R la topología 
euclídea. 
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1.4 Algunos conceptos topológicos 

Dedicamos esta sección a desarrollar el lenguaje topológico, es decir, a intro- 
ducir las características de un espacio y sus subconjuntos que pueden definirse 
a partir de su topología. Hasta ahora hemos visto únicamente los conceptos de 
abierto y entorno. Otro concepto importante es el dual conjuntista de "abierto" : 

Definición 1.28 Diremos que un subconjunto de un espacio topológico es ce- 
rrado si su complementario es abierto. 

Por ejemplo, un semiplano (sin su recta frontera) es un conjunto abierto, 
mientras que un semiplano con su frontera es cerrado, pues su complementario 
es el semiplano opuesto sin su borde, luego es abierto. Pronto veremos que la 
diferencia entre los conjuntos abiertos y los cerrados es precisamente que los 
primeros no contienen a los puntos de su borde y los segundos contienen todos 
los puntos de su borde. En importante notar que un conjunto no tiene por qué 
ser ni abierto ni cerrado. Baste pensar en el intervalo [0, 1[. 

Ejercicio: Sea X = [0, 1] U ]3, 4]. Probar que ]3, 4] es a la vez abierto y cerrado en X. 

Las propiedades de los cerrados se deducen inmediatamente de las de los 
abiertos: 

Teorema 1.29 Sea X un espacio topológico. Entonces: 

a) 0 y X son cerrados. 

b) La intersección de cualquier familia de cerrados es un cerrado. 

c) La unión de dos cerrados es un cerrado. 

Puesto que la unión de abiertos es abierta, al unir todos los abiertos con- 
tenidos en un conjunto dado obtenemos el mayor abierto contenido en él. Si- 
milarmente, al intersecar todos los cerrados que contienen a un conjunto dado 
obtenemos el menor cerrado que lo contiene: 

Definición 1.30 Sea X un espacio topológico. Llamaremos interior de un 
conjunto A C X al mayor abierto contenido en A. Lo representaremos por 
int A o A- Llamaremos clausura de A al menor cerrado que contiene a A. Lo 

o 

representaremos por el A o A. Los puntos de A se llaman puntos interiores de 
A, mientras que los de A se llaman puntos adherentes de A. 

o 

Así pues, para todo conjunto A tenemos que AC A C A. El concepto de 
punto interior es claro: un punto x es interior a un conjunto A si y sólo si A es 
un entorno de x. Por ejemplo, en un semiplano cerrado, los puntos interiores 
son los que no están en el borde. El teorema siguiente nos caracteriza los puntos 
adherentes. 

Teorema 1.31 Sea X un espacio topológico y A un subconjunto de X. Un 
punto x es adherente a A si y sólo si todo entorno de x corta a A. 
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DEMOSTRACIÓN: Supongamos que x es adherente a A. Sea U un entorno 
de x. Existe un abierto G tal que x £ G C U. Basta probar que G <1 A ^ 0. 
Ahora bien, en caso contrario X \ G sería un cerrado que contiene a A, luego 
A C X \ G, mientras que x £ A n G. 

Recíprocamente, si x tiene esta propiedad entonces x € A, ya que de lo 
contrario X \ A sería un entorno de x que no corta a A. ■ 

Vemos, pues, que, como su nombre indica, los puntos adherentes a un con- 
junto A son los que "están pegados" a A, en el sentido de que tienen alrededor 
puntos de A. Por ejemplo, es fácil ver que los puntos adherentes a un semi- 
plano abierto son sus propios puntos más los de su borde. Veamos ahora que el 
concepto de borde corresponde a una noción topológica general: 

Definición 1.32 Sea X un espacio topológico y A C X. Llamaremos frontera 
de A al conjunto dA = A n X \ A. 

Así, los puntos frontera de un conjunto son aquellos que tienen alrededor 
puntos que están en A y puntos que no están en A. Esto es claramente una 
definición general del "borde" de un conjunto. Por ejemplo, la frontera de un 
triángulo la forman los puntos de sus lados. 

Teorema 1.33 Sea X un espacio topológico. Se cumple: 

o o 

a) Si A C X entonces AC A C A, además A es abierto y A es cerrado. 

o 

b) SíAdBdXyAes abierto entonces AdB- 

c) SiAcBcXyBes cerrado entonces A C B. 

d) Si A C B C X entonces ACB yAcB. 

e) Si A, B C X, entonces int (A n B) = int A n int B, A(J B = A(JB. 

o 

f) A C X es abierto si y sólo si A =A, y es cerrado si y sólo si A = A. 

g) Si A C B C X, entonces A B = A* n B. 

h) Si Ad X, entonces int (X \ A) =X\c\A yc\{X\A) =X\intA 

Demostración: Muchas de estas propiedades son inmediatas. Probaremos 
sólo algunas. 

e) Claramente AU B C AU B, y el segundo conjunto es cerrado, luego 
AU B CAUB. Por otra parte es claro que A C A U B y B C AU B, luego 
tenemos la otra inclusión. La prueba con interiores es idéntica. 

g) Observemos en primer lugar que los cerrados de B son exactamente las 
intersecciones con B de los cerrados de A. En efecto, si C es cerrado en X 
entonces A \ C es abierto en X, luego B n (A \ C) = B \ C es abierto en B, 
luego B \ (B \ C) = B n C es cerrado en B. El recíproco es similar. 
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Por definición, A es la intersección de todos los cerrados en X que contienen 



a A, luego A n B es la intersección de todas las intersecciones con B de los 
cerrados en X que contienen a A, pero estos son precisamente los cerrados de 
B que contienen a A, o sea, A n B es exactamente A . 

h) Tenemos que A C el A, luego X \ el A C X \ A y el primero es abierto, 
luegoX\clAcint(X\A). 

Por otra parte int (X \ A) C X \ A, luego A C X \ int (X \ A), y éste es 
cerrado, luego A C X \ int (X \ A) y int (X \ A) C X \ A ■ 

En la prueba de la propiedad g) hemos visto lo siguiente: 

Teorema 1.34 Si X es un espacio tope-lógico y A C X, los cerrados en la 
topología relativa de A son las intersecciones con A de los cerrados de X. 

Conviene observar que el análogo a g) para interiores es falso. Es decir, no 
se cumple en general que A B =A C\B. Por ejemplo, es fácil ver que en R se 
cumple N = 0, luego N n Z = 0, mientras que N z = N. 

Vamos a retinar el concepto de punto adherente. Hemos visto que los puntos 
adherentes a un conjunto A son aquellos que tienen alrededor puntos de A. 
Sucede entonces que todo punto x G A es trivialmente adherente, porque x es 
un punto de alrededor de x y está en A. Cuando eliminamos esta posibilidad 
trivial tenemos el concepto de punto de acumulación: 

Definición 1.35 Sea X un espacio topológico y A C X. Diremos que un 
punto i£les un punto de acumulación de A si todo entorno U de x cumple 
(U\{x})ílA ^ 0. El conjunto de puntos de acumulación de A se llama conjunto 
derivado de A y se representa por A'. 

Ejemplo Consideremos el conjunto 4= {l/n | n £ N \ {0}} C R. Es fácil 
ver que A = A U {0}. Sin embargo, A' = {0}. En efecto, en general se cumple 
que A' C A, pero ningún punto 1/n G A es de acumulación, pues 

"1 11 1 

n n + 1 ' n n+í 

es un entorno de 1/n que no corta a A salvo en este mismo punto. ■ 

Como ya hemos dicho, siempre es cierto que A' C A. También es claro que 
un punto adherente que no esté en A ha de ser un punto de acumulación de A. 
En otras palabras, A = Al) A' . Los puntos de A pueden ser de acumulación o 
no serlo. Por ejemplo, todos los puntos de [0, 1] son de acumulación, mientras 
que los puntos del ejemplo anterior no lo eran. 

Definición 1.36 Sea X un espacio topológico y A C X. Los puntos de A \ A' 
se llaman puntos aislados de A. 
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Un punto x € A es aislado si y sólo si tiene un entorno U tal que UOA = {x}. 
El entorno lo podemos tomar abierto, y entonces vemos que los puntos aislados 
de A son los puntos que son abiertos en la topología relativa. Vemos, pues, que 
un espacio es discreto si y sólo si todos sus puntos son aislados. Es el caso del 
ejemplo anterior. 

Definición 1.37 Un subconjunto A de un espacio topológico X es denso si 
A = X. 

Aplicando la propiedad h) de 1.33 vemos que A es denso en X si y sólo si 
X \ A tiene interior vacío, es decir, si y sólo si todo abierto de X corta a A. 
Esto significa que los puntos de A están "en todas partes". Por ejemplo, puesto 
que todo intervalo de números reales contiene números racionales e irracionales, 
es claro que Q y R\Q son densos en R. De aquí se sigue fácilmente que Q™ y 
(R\Q)" son densos en R™. 

Ejercicio: Probar que si A es abierto en un espacio X y D es denso en X entonces 
A n D es denso en A. 

Hay una propiedad que no cumplen todos los espacios topológicos, pero sí 
la práctica totalidad de espacios de interés. 

Definición 1.38 Diremos que un espacio topológico X es un espacio de Haus- 
dorff si para todo par de puntos distintos x, y € X existen abiertos disjuntos U 
y V tales que x € U, y € V (se dice que los abiertos U y V separan a x e y). 

Por ejemplo, si en un conjunto X con más de un punto consideramos la 
topología formada únicamente por los abiertos 0 y X (topología trivial) obte- 
nemos un espacio que no es de Hausdorff. Se trata de un espacio patológico 
donde todo punto está alrededor de cualquier otro. Aunque la topología trivial 
es ciertamente la más patológica posible, lo cierto es que todas las topologías 
no de Hausdorff comparten con ella su patología, y rara vez resultan de interés. 
Veamos las propiedades de los espacios de Hausdorff: 

Teorema 1.39 Se cumplen las propiedades siguientes: 

a) En un espacio de Hausdorff, todo conjunto finito es cerrado. 

b) Todo espacio de Hausdorff finito es discreto. 

c) Todo subespacio de un espacio de Hausdorff es un espacio de Hausdorff. 

d) El producto de una familia de espacios de Hausdorff es un espacio de 
Hausdorff. 

e) Todo espacio métrico es un espacio de Hausdorff. 

f) Un espacio X es de Hausdorff si y sólo si la diagonal A = {(a;, x) \ x £ X} 
es cerrada en X x X. 
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DEMOSTRACIÓN: a) Basta probar que todo punto {x} en un espacio de 
Hausdorff X es cerrado. Ahora bien, dado y € X\{x}, existen abiertos disjuntos 
U, V tales que x G U, y € V, luego y € V C X\ {x}, lo que prueba que X \ {x} 
es entorno de todos sus puntos, luego {x} es cerrado. 

b) En un espacio de Hausdorff finito todo subconjunto es cerrado, luego todo 
subconjunto es abierto, luego es discreto. 

c) Si X es un espacio de Hausdorff y A C X, dados dos puntos x, y e A, 
existen abiertos disjuntos U, V en X que separan a x e y, luego U f~l A, V íl A 
son abiertos disjuntos en A que separan a x e y. 

d) Consideremos un producto de espacios de Hausdorff ]J Xi y dos de sus 

iei 

puntos x, y. Sea Íq un índice tal que Xi 0 ^ y¿ 0 . Existen abiertos [/, V" en X¿ 0 
que separan a x¿ 0 e j/¿ 0 . Entonces p~^(U) y son abiertos subbásicos 

disjuntos en el producto que separan a, x e y. 

e) Si X es un espacio métrico, dos de sus puntos x, y están separados por 
las bolas de centros x, y y radio d(x,y)/2. 

f) La diagonal A es cerrada si y sólo si su complementario es abierto, si y 
sólo si para todo par (x, y) £ X x X con x ^ y existe un abierto básico U x V 
en X x X tal que (x,y) € U x V C X x X \ A. Ahora bien, la condición 
U xV C X x X\A equivale a, U ílV = 0, luego la diagonal es cerrada si y sólo 
si X es Hausdorff. ■ 

Ejercicio: Probar que si un producto de espacios topológicos es un espacio de Haus- 
dorff no vacío, entonces cada uno de los factores es un espacio de Hausdorff. 

Terminamos la sección con algunas propiedades métricas, no topológicas, es 
decir propiedades definidas a partir de la distancia en un espacio métrico y que 
no se pueden expresar en términos de su topología. 

Definición 1.40 Un subconjunto A de un espacio métrico es acotado si existe 
un M > 0 tal que para todo par de puntos x, y € A se cumple d(x 7 y) < M. 
El diámetro de un conjunto acotado A es el supremo de las distancias d(x, y) 
cuando (x, y) varía en A x A. 

Es fácil probar que todo subconjunto de un conjunto acotado es acotado, 
así como que la unión finita de conjuntos acotados está acotada. Sin embargo 
hemos de tener presente el hecho siguiente: dado un espacio métrico M, podemos 
definir d'(x, y) = mín{ 1, d(x, y) } . Es fácil ver que d! es una distancia en M y las 
bolas de radio menor que 1 para d! coinciden con las bolas respecto a d. Como 
estas bolas forman una base de las respectivas topologías métricas concluimos 
que ambas distancias definen la misma topología. Sin embargo, respecto a d! 
todos los conjuntos están acotados. Esto prueba que el concepto de acotación 
no es topológico. 

Ejercicio: Calcular el diámetro de una bola abierta en R" y en un espacio con la 
métrica discreta. 
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Definición 1.41 Si M es un espacio métrico, A ^ 0 un subconjunto de M y 
x G M, definimos la distancia de x a A como d(x, A) = ínf{d(x, y) | y € A}. 

Es evidente que si x € A entonces A) = 0, pues entre las distancias cuyo 
ínfimo determinan d(x, A) se encuentra d(x, x) = 0. Sin embargo los puntos que 
cumplen d(x, A) = 0 no están necesariamente en A. 

Teorema 1.42 Si M es un espacio métrico y A C M, entonces un punto x 
cumple d(x,A) = 0 si y sólo si x es adherente a A. 

Demostración: Si d(x, A) = 0, para probar que es adherente basta ver que 
toda bola abierta de centro x corta a A. Dado e > 0 tenemos que d(x, A) < e, 
lo que significa que existe un y £ A tal que d(x,y) < e, es decir, y € B e (x) n A. 
El recíproco se prueba igualmente. ■ 

En el caso de espacios normados podemos hacer algunas afirmaciones adi- 
cionales. La prueba del teorema siguiente es inmediata. 

Teorema 1.43 Sea E un espacio normado y A C E. Las afirmaciones siguien- 
tes son equivalentes: 

a) A es acotado. 

b) Existe un M > 0 tal que \\x\\ < M para todo x € A. 

c) Existe un M > 0 tal que A C B M (0)- 

Ejercicio: Probar que en un espacio normado la clausura de una bola abierta es la 
bola cerrada del mismo radio y el interior de una bola cerrada es la bola abierta. ¿Cuál 
es la frontera de ambas? Dar ejemplos que muestren la falsedad de estos hechos en un 
espacio métrico arbitrario. 

1.5 Continuidad 

Finalmente estamos en condiciones de formalizar la idea de función continua 
como función / que envía los alrededores de un punto a los alrededores de su 
imagen. No exigimos que las imágenes de los puntos de alrededor de un punto x 
sean todos los puntos de alrededor de f(x). Por ejemplo, sea S la circunferencia 
unidad en R 2 y / la aplicación dada por 

[0,1] — S 
x i ► (cos27rx,sen27ra;) 

Lo que hace / es "pegar" los extremos del intervalo en un mismo punto (1, 0). 
Queremos que esta aplicación sea continua, y vemos que [0, 1/4] es un entorno 
de 0 que se transforma en "medio" entorno de (1,0), en los puntos de alrededor 
de (1, 0) contenidos en el semiplano y > 0. Esto no debe ser, pues, un obstáculo 
a la continuidad. 
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Pedir que los puntos de alrededor de x sean enviados a puntos de alrededor de 
f(x) (no necesariamente todos) es pedir que todo entorno U de f(x) contenga 
a las imágenes de los puntos de alrededor de x, es decir, las imágenes de un 
entorno de x, es decir, que contenga un entorno de x, pero esto equivale 

a que él mismo lo sea. Así pues: 

Definición 1.44 Una aplicación / : X — > Y entre dos espacios topológicos 
es continua en un punto x € X si para todo entorno U de f(x) se cumple que 
es un entorno de x. Diremos que / es continua si lo es en todos los 
puntos de x. 

Observar que en esta definición podemos sustituir "entorno" por "entorno 
básico" . En un espacio métrico podemos considerar concretamente bolas abier- 
tas, y entonces la definición se particulariza como sigue: 

Teorema 1.45 Una aplicación f : M — > N entre dos espacios métricos es 
continua en un punto x € M si y sólo si para todo e > 0 existe un S > 0 tal que 
si d(x,x') < 5 entonces d(f(x),f(x')) < e. 

Veamos varias caracterizaciones de la continuidad. 

Teorema 1.46 Sea f : X — > Y una aplicación entre espacios topológicos. Las 
afirmaciones siguientes son equivalentes: 

a) f es continua. 

b) Para todo abierto (básico) G de Y se cumple que / _1 [G] es abierto en X. 

c) Para todo cerrado C de Y se cumple que f~ 1 [C] es cerrado en X. 

d) Para todo A C X se cumple f[A] C f[A]. 

e) Para todo B C Y se cumple f'^B] C f'^B]. 

f) Para todo B C Y se cumple / _1 [intS] C int/ _1 [B]. 

Demostración: a) <-> b). Si / es continua y x e entonces f(x) e G, 

luego G es un entorno de f(x), luego por definición de continuidad / _1 [G] es 
un entorno de x, luego / _1 [G] es abierto. Es claro que b) — > a). 

Evidentemente b) <-> c). 

a) — > d). Si a; £ f[A] entonces x = f{y), con y £ A. Si E es un entorno de x, 
por definición de continuidad ¡^[E] es un entorno de y, luego (14^0, 
de donde E n f[A] ^ 0, lo que prueba que x € f[A]. 



d) -> e). Tenemos que /^[B] C X, luego /[/"M-E?]] C /[/"M^]] C B, 
luego C /-MS]. 
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e) — > f). En efecto: 

rMints] = r 1 [y\(r\inti?)] =x\r 1 [y\int J B] 

= x\r 1 [F\s] cX\f-i\Y\B] = X\X\f-i[B] 
= X\(X\mtf- 1 [B})=mtf- 1 [B}. 

f) — > b). Si B es abierto en Y, entonces 

r x [B\ = rvts] c int/- 1 ^] c r 1 ^], 

luego = int/ _1 [.B] que es, por lo tanto, abierto. ■ 

Ahora vamos a probar una serie de resultados generales que nos permitirán 
reconocer en muchos casos la continuidad de una aplicación de forma inmediata. 
De la propia definición de continuidad se sigue inmediatamente: 

Teorema 1.47 Si f : X — > Y es continua en un punto x y g : Y — > Z es 
continua en f{x), entonces fog es continua en x. En particular, la composición 
de aplicaciones continuas es una aplicación continua. 

Otro hecho básico es que la continuidad depende sólo de la topología en la 
imagen y no de la del espacio de llegada. 

Teorema 1.48 Sea f : X — > Y una aplicación entre espacios topológicos. 
Entonces f es continua en un punto x € X como aplicación f : X — > Y si y 
sólo si lo es como aplicación f : X — > f[X]- 

Demostración: Un entorno de f(x) en f[X] es U n f[X], donde U es un 
entorno de f(x) en Y, pero / -1 [L/n A] = f~ 1 [U], luego es indistinto considerar 
entornos en f[X] o en y. ■ 

Teniendo en cuenta que la aplicación identidad en un conjunto es obviamente 
continua, de los teoremas anteriores se deduce inmediatamente el que sigue: 

Teorema 1.49 Si X es un espacio topológico y A C X, entonces la inclusión 
i : A — > X dada por i(x) = x es continua. Por tanto, si f : X — > Y es 
continua en un punto x € A, la restricción f\¿ = i o f es continua en x. 

En particular la restricción de una aplicación continua a un subconjunto es 
también continua. El recíproco no es cierto, pero se cumple lo siguiente: 

Teorema 1.50 Dada una aplicación f : X — > Y, si A es un entorno de un 
punto x € X y J\a es continua en x, entonces f es continua en x. 

DEMOSTRACIÓN: Si U es un entorno de f(x) en Y, entonces = 
/ _1 [Í7] fl A es un entorno de x en A, luego existe un entorno G de x en X de 
manera que x e G <1 A = / _1 [Í7] íl A, luego en particular igGniC / _1 [^1> 
y G n A es un entorno de x en X, luego / _1 [Í7] también lo es. ■ 
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Esto significa que la continuidad es una propiedad local, es decir, el que una 
función sea continua o no en un punto es un hecho que sólo depende del compor- 
tamiento de la función en un entorno del punto. En particular, si cubrimos un 
espacio topológico por una familia de abiertos, para probar que una aplicación 
es continua basta ver que lo es su restricción a cada uno de los abiertos. Esto es 
cierto también si cubrimos el espacio con cerrados a condición de que sean un 
número finito. 

Teorema 1.51 Sea f : X — > Y una aplicación entre espacios topológicos. 
Sean C\ , . . . , C n subconjuntos cerrados de X tales que X = C\ U • • • U C' n . 
Entonces f es continua si y sólo si cada /|c¿ es continua. 

Demostración: Una implicación es obvia. Si las restricciones son conti- 
nuas, entonces dado un cerrado C de Y, se cumple que 

r Me] = (/"Me] n d) u • • • u (r Me] n c n ) = (/IcJ" 1 ^ u ■ ■ ■ u (/IcJ" 1 ^]- 

Ahora, cada (/|c¿) _1 [C] es cerrado en C¿, luego es la intersección con C¿ de 
un cerrado de X, luego es la intersección de dos cerrados en X, luego es cerrado 
en X. Así pues, / -1 [C] es la unión de un número finito de cerrados de X, luego 
es cerrado en X. Esto prueba que / es continua. ■ 



Teorema 1.52 Si {Xi} ie i es una familia de espacios topológicos, las proyec- 
ciones pi : J| Xi — > Xi son funciones continuas, 
iei 

Demostración: Las antiimágenes de abiertos en A¿ son abiertos básicos 
del producto. ■ 

Ejercicio: Probar que la topología producto es la menor topología que hace continuas 
a las proyecciones. 



Teorema 1.53 Si {Xi} i& j es una familia de espacios topológicos y X es un 
espacio topológico, entonces una aplicación f : X — > Tí^i es continua si y 
sólo si lo son todas las funciones f% = f op¿. ieI 

DEMOSTRACIÓN: Si / es continua las funciones f 'opi también lo son por ser 
composición de funciones continuas. 

Si cada f o p i es continua, sea A = Y[ M un abierto básico del producto. 

iei 

Sean ii,...,i n los índices tales que A¡ ^ X iy Entonces / _1 [p" 1 ^^]] = 
(/ 0 Pi j )~ 1 [Aí j ] es abierto en X, pero 

n n 

A=f] P 7 j 1 [A t] } y r 1 [A] = nr 1 K 1 K-]] 

es abierto en A. ■ 
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Así, por ejemplo, para probar que la aplicación / : R — > M 2 dada por 
f(x) = (x + l,x 2 ) es continua, basta probar que lo son las aplicaciones x + 1 
y x 2 . 

Definición 1.54 Sean E y F espacios normados. Una aplicación / : E — > F 
tiene la propiedad de Lipschitz si existe un M > 0 tal que para todos los vectores 
v, w € E se cumple que ||/(v) — f(w)\\ < M\\v — w\\. 

Teorema 1.55 Las aplicaciones con la propiedad de Lipschitz son continuas. 

DEMOSTRACIÓN: Sea / : E — > F una aplicación con la propiedad de 
Lipschitz con constante M. Vamos a aplicar el teorema 1.45. Dado e > 0 
tomamos 8 = e/M. Así, si \\v — w\\ < 8, entonces \\f(v) — f(w)\\ < M\\v— w\\ < e. 

m 

Por ejemplo, es fácil ver que si E es un espacio normado entonces la norma 
|| : E — > R tiene la propiedad de Lipschitz con constante M = 1, luego es 
una aplicación continua. Un ejemplo menos trivial es el de la suma: 

Teorema 1.56 Sea E un espacio normado. Entonces la suma + : ExE — > E 
tiene la propiedad de Lipschitz, luego es continua. 

DEMOSTRACIÓN: Consideraremos a E x E como espacio normado con la 
norma || ||i. Entonces, si (u,v), (a, b) € E x E, tenemos que 

||(u + t;)-(a + 6)|| = ||(«-a) + (v-6)||<||«-o|| + ||t;-6|| 
= ||(«- a, v - b)\U = \\(u, v )-(o,6)||i. 



El producto no cumple la propiedad de Lipschitz, pero aun así es continuo. 

Teorema 1.57 Sea E un espacio normado. El producto ■ : K x E — > E es 
una aplicación continua. 

DEMOSTRACIÓN: Veamos que el producto es continuo en un punto (X,x) de 
K x E. Usaremos la norma || en K x E. Dado e > 0, sea (A',x') e K x E. 

|| AV - Ax|| = \\X'(x' -x) + (A' - A)as|| < |A'| \\x' - x\\ + |A' - A| ||x||. 

Tomemos ahora 0 < 8 < 1 que cumpla además 

„ e 
< |A| + ||x|| + l <e ' 

Así si ||(A',x') - (X,x)\\oo < 8, entonces |A' - A| < 8 y \\x' - x\\ < 8. En 
particular |A'| < |A| + 5 < |A| + 1. Así 

HA'or' - Aa;|| < — ^4 7 + m ^jr4 — 7 < e - 

11 11 A+ \x +1 A+ \\x +1 
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Definición 1.58 Un espacio vectorial topológico es un par (V, T), donde V es 
un espacio vectorial sobre KyTes una topología de HausdorfT sobre V de modo 
que las aplicaciones + : V x V — > V y • : K x V — > V son continuas. 

Hemos demostrado que todo espacio normado es un espacio vectorial to- 
pológico. 

En general, si X es un conjunto y V es un espacio vectorial sobre un cuerpo 
K, el conjunto V x de todas las aplicaciones de X en V es un espacio vectorial 
con las operaciones dadas por (/ + g)(x) = f(x) + g(x) y (af) (x) = af(x). 

Si X e Y son espacios topológicos, llamaremos C(X, Y) al conjunto de todas 
las aplicaciones continuas de X en Y. 

Si X es un espacio topológico y V un espacio vectorial topológico, entonces 
C(X, V) resulta ser un subespacio de V x , pues la suma de dos funciones conti- 
nuas / y g puede obtenerse como composición de la aplicación h : X — > V xV 
dada por h(x) = (f(x),g(x)), que es continua, y la suma en V, que también lo 
es, luego / + g es continua. 

Similarmente se prueba que si a G K y / € C(X, V), entonces af € C(X, V). 

El espacio K x tiene también estructura de anillo conmutativo y unitario con 
el producto dado por (fg)(x) = f(x)g(x). Como el producto • : K x K — > K es 
continuo (tomando E = K en el teorema anterior) , resulta que C(X, K) es un 
subanillo de K x . 

En general, una cuádrupla (A, +, •, o), donde la terna (A, +, •) es un espacio 
vectorial sobre un cuerpo K, la terna (A,+,o) es un anillo unitario y además 
a(ab) = (aa)b = a(ab) para todo a G K, y todos los o, b € A, se llama una 
if-álgebra. 

Tenemos, pues, que si X es un espacio topológico, entonces C(X,K) es una 
K-álgebra de funciones. El espacio C(X,K) contiene un subcuerpo isomorfo a 
K, a saber, el espacio de las funciones constantes. Cuando no haya confusión 
identificaremos las funciones constantes con los elementos de K, de modo que 2 
representará a la función que toma el valor 2 sobre todos los puntos de X. 

Más aún, si p(x\ , . . . , x n ) € K[x\ , . . . , x n ] , el polinomio p determina una 
única función evaluación p : K™ — > K, de modo que los polinomios constan- 
tes se corresponden con las funciones constantes y la indeterminada Xi con la 
proyección en la i-ésima coordenada. Como todo polinomio es combinación de 
sumas y productos de constantes e indeterminadas, tenemos que K[xi, . . . , x n ] C 
C(K n ,K). 

Por ejemplo, la aplicación / : IR 3 — ► IR 2 dada por f(x, y, z) = (3x — 2yz, xyz) 
es claramente continua. 

Teorema 1.59 La aplicación h :K \ {0} — > K dada por h(x) = 1/x es conti- 
nua. 

Demostración: Sea x e K \ {0}. Sea 6 = \x\/2. Si y £ B s (x) entonces 
| — x — (y — x)\ > || — x\ — \y — x\\, o sea, \y\ > \x\ — S = S. 
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Dado e > 0, sea 8' < 1, 8' < 8\x\e. Así, si \y — x\ < 8' tenemos 
1 1 



x\ < 8\x\e 



\y\\x\ 8\x\ 



Consecuentemente, si / £ C(X,K) y / no se anula en X, podemos definir 
la función 1// € C(X,K) mediante (1//)(V) = l/f(x). 

Por ejemplo, la función / : E \ {1} — > E dada por 

'<*> " Í^T 

es obviamente continua. 

Teorema 1.60 La función \J~ : [0, +oo[ — > [0, +oo[ es continua. 

Demostración: Basta notar que 

Va: € ]a, 6[ <-> a < Va; < 6 <-> a 2 < x < b 2 <-» a; € ] a 2 , o 2 [ . 

Esto significa que la antiimagen del intervalo ]a, o[ es el intervalo ] a 2 , o 2 [. Simi- 
larmente se ve que la antiimagen de un intervalo [0,b[ es el intervalo [0, b 2 [ y, 
como estos intervalos constituyen una base de [0, +oo[, tenemos que y/ es una 
función continua. ■ 

Teorema 1.61 Sea M un espacio métrico y A ^ 0 un subconjunto de M. 
Entonces las aplicaciones d: M x M — > E y d{ , A) : M — > E son continuas. 

Demostración: Consideremos en M x M la distancia doo. Dado un par 
(a;, y) G M x M, y un e > 0, basta probar que si (x',y') dista de (a;, y) menos 
de e/2, es decir, si se cumple d(x,x') < e/2 y d(y,y') < e/2, entonces tenemos 
\d(x,y) — d(x',y')\ < e. En efecto, en tal caso 

d(x, y) < d(x, x 1 ) + d(x', y') + d(y', y) < d(x', y') + e, 

luego d(x, y) — d(x' , y') < e, e igualmente se llega a d(x' , y') — d(x, y) < e, luego 
efectivamente \d(x,y) — d(x',y')\ < e. 

Para probar la continuidad de d( , A) en un punto x observamos que 

\d{x,A)-d{y,A)\ < d(x,y). 

En efecto, para todo z € A se cumple d(x,z) < d(x,y) + d(y,z). De aquí se 
sigue claramente d(x, A) < d(x, y) + d(y, z), y tomando el ínfimo en z vemos que 
d(x, A) < d(x, y) + d(y, A) . Similarmente se prueba d(y, A) < d(x, y) + d(x, A) , 
de donde se sigue la relación con valores absolutos. A su vez esta relación implica 
que si d(x, y) < e, entonces \d(x, A) — d(y, A)\ < e, lo que expresa la continuidad 
de la aplicación. ■ 

Para terminar con las propiedades generales de las aplicaciones continuas 
probaremos un hecho de interés teórico: 
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Teorema 1.62 Sean f,g : X — > Y aplicaciones continuas, D <Z X un con- 
junto denso tal que f\r> = g\n y supongamos que Y es un espacio de Hausdorff. 
Entonces f = g. 

Demostración: Sea h : X — > Y x Y dada por h(x) = (f(x),g(x)). 
Claramente es continua y h[D] C A, donde A = {(y, y) | y € Y} es un cerrado 
en Y x Y (por 1.39). Por lo tanto h[X] = h[D] C h\D] C A, de donde / = g. 



Definición 1.63 Una aplicación biyectiva / : X — > Y entre dos espacios 
topológicos es un homeomorfismo si / y su inversa son ambas continuas. Dos 
espacios topológicos son homeomorfos si existe un homeomorfismo entre ellos. 

Un homeomorfismo induce una biyección entre los abiertos de los dos es- 
pacios, por lo que ambos son topológicamente indistinguibles. Es claro que 
cualquier propiedad definida exclusivamente a partir de la topología se con- 
serva por homeomorfismos, luego dos espacios homeomorfos tienen las mismas 
propiedades topológicas. 

Es importante notar que no toda biyección continua es un homeomorfismo. 
Por ejemplo, la identidad / : R — > IR, cuando en el primer espacio consideramos 
la topología discreta y en el segundo la euclídea es biyectiva y continua, pero 
no un homeomorfismo. Veamos un ejemplo más intuitivo: 

Ejemplo Sea / : [0,1] U]2,3] — > [0,2] la 2 

aplicación dada por 

, 1 
i(\_\x si 0 < x < 1 

[x-1 si 2 < x < 3 

0 

Es fácil ver que / es biyectiva, y es continua 
porque sus restricciones a los abiertos [0, 1] y 0 1 2 3 

]2,3] de su dominio son ambas continuas (son polinomios). Sin embargo no 
es un homeomorfismo. La aplicación / _1 es continua en todos los puntos de 
[0,2] excepto en x = 1. En efecto, [0, 1] es un entorno de / _1 (1) = 1, pero la 
antiimagen de este intervalo es el mismo [0,1], que no es un entorno de 1 en 
[0,2]. En los demás puntos es continua, pues f^ 1 restringida a los abiertos de 
su dominio [0, 1[ y ]1,2] es polinómica. 

Lo que sucede es que, a pesar de ser biyectiva, / está "pegando" los intervalos 
[0,1] y ]2,3] en el intervalo [0,2], por lo que / _1 "corta" éste por el punto 1. 
En general, si una aplicación continua es una aplicación que no corta, aunque 
puede pegar, un homeomorfismo es una aplicación que no corta ni pega. Para 
que no pegue ha de ser biyectiva, pero acabamos de ver que esto no es suficiente. 
El ejemplo de la topología discreta se interpreta igual: los puntos de R con la 
topología discreta están todos "separados" entre sí, luego al pasar a R con la 
topología euclídea los estamos "pegando", aunque no identifiquemos puntos. 
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Definición 1.64 Una aplicación / : X — > Y entre dos espacios topológicos es 
abierta si para todo abierto A de X, se cumple que f[A] es abierto en Y. 

De este modo, un homeomorfismo es una biyección continua y abierta. La 
propiedad de ser abierta no es muy intuitiva y tampoco es muy frecuente (salvo 
en el caso de los homeomorfismos) . Sin embargo es de destacar el hecho si- 
guiente: 

Teorema 1.65 Las proyecciones de un espacio producto en cada uno de sus 
factores son aplicaciones abiertas. 

Demostración: Basta ver que la proyección de un abierto básico es un 
abierto, pero los abiertos básicos son productos de abiertos, y las proyecciones 
son sus factores. ■ 

Definición 1.66 La gráfica de una aplicación / : X — > Y es el conjunto 1 

{(x,f{x)) eXxY\xex}. 

En los casos de funciones / : A C W n — > R™, donde m + n < 3 la gráfica de 
/ tiene una interpretación en el plano o espacio euclídeo intuitivos, y esta repre- 
sentación permite reconocer rápidamente las características de /. El resultado 
más importante por lo que a la continuidad se refiere es el siguiente: 

Teorema 1.67 Si f : X — > Y es una aplicación continua, entonces la apli- 
cación x i ► (x, f{x)) es un homeomorfismo entre X y la gráfica de f. 

DEMOSTRACIÓN: La aplicación es obviamente biyectiva y continua. Su 
inversa es la restricción a la gráfica de la proyección sobre el primer factor de 
X x Y, luego también es continua. ■ 

Ejemplo La gráfica del polinomio x 3 — x es la siguiente: 




1 Observar que desde el punto de vista de la teoría de conjuntos la gráfica de una función 
/ es la propia función / como conjunto. 



1.5. Continuidad 



29 



El lector debería preguntarse cómo se sabe que la gráfica de / tiene esta 
forma y no otra. Mas adelante veremos cómo determinar analíticamente las 
características de la gráfica de una función, pero de momento nos bastará con 
lo siguiente: 

Para obtener una figura como la anterior, basta programar a un ordenador 
para que calcule la función considerada sobre los suficientes números racionales, 
digamos sobre los números de la forma fc/100, donde k varía entre —200 y 200, 
y dibuje un pequeño cuadrado con coordenadas (a;, /(#)). El resultado es una 
gráfica como la que hemos mostrado. El proceso sólo involucra la aritmética de 
los números racionales, que no tiene ninguna dificultad. 

Vemos que la gráfica de / es una línea ondulada. Podemos considerarla 
como una imagen "típica" de espacio homeomorfo a IR. Se obtiene deformando 
la recta "elásticamente", sin cortarla ni pegarla. La aplicación / no es un 
homeomorfismo, la gráfica muestra cómo transforma a IR en su imagen: ésta 
resulta de "aplastar" la curva sobre el eje vertical, con lo que IR se "pliega" 
sobre sí mismo, de modo que parte de sus puntos se superponen tres a tres. 

■ 

Veamos ahora un ejemplo de gráfica de una función discontinua. 
Ejemplo Consideremos la función / : IR — > [0, 1] dada por 



Es claro que / es continua en todo punto distinto de 0. En efecto, su res- 
tricción al abierto ]— oo, 0[ es constante, luego continua, su restricción al abierto 
]0, +oo[ también es continua, pues este abierto es a su vez unión de dos cerrados, 
]0, 1] y [l,+oo[, en los cuales / es continua, pues en el primero es el polinomio 
x y en el segundo es constante. Es fácil ver que / no es continua en 0. 

La gráfica de / no es homeomorfa a IR. No estamos en condiciones de pro- 
barlo ahora. Es fácil ver que x (x, f(x)) no es un homeomorfismo, pero esto 
no prueba que no exista otra biyección que sí lo sea. De todos modos, intui- 
tivamente vemos que la gráfica está formada por dos piezas, por lo que para 
transformar IR en la gráfica es necesario "cortar" por algún punto. ■ 

Ejemplo Los homeomorfismos no pueden "cortar" ni "pegar", pero sí "esti- 
rar" arbitrariamente un conjunto. Por ejemplo, la homotecia f(x) — ax, donde 
a > 0 transforma el intervalo [—1,1] en el intervalo [—a, a]. Las traslaciones 




si x < 0 
si 0 < x < 1 



Su gráfica es la siguiente: 
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x i ► x ~\~ b son claramente homeomorfismos de IR, luego combinando homote- 
cias y traslaciones podemos construir un homeomorfismo entre cualquier par de 
intervalos cerrados de la forma [a, b]. También es claro que cualquier par de 
intervalos abiertos ]a, b[ son homeomorfos entre sí, al igual que cualquier par de 
intervalos semiabiertos [a, b[ y ]a, b). En la sección siguiente veremos que también 
es posible "estirar infinitamente" un intervalo, de modo que, por ejemplo, ]0,1[ 
es homeomorfo a IR. ■ 



La topología euclídea Notemos que toda aplicación lineal / : K™ — > K m es 
continua, pues es cada una de sus funciones coordenadas es un polinomio. En 
particular todo automorfismo de K™ es un homeomorfismo. Si V es cualquier 
K-espacio vectorial de dimensión finita n, existe un isomorfismo / : V — > K n . 
Podemos considerar la topología en V formada por los conjuntos f~ x [G], donde 
G es abierto en K" para la topología euclídea. Es claro que V es así un espacio 
topológico homeomorfo a K™. Además, la topología en V no depende de la 
elección de /, pues si g : V — > K n es cualquier otro isomorfismo y G es un 
abierto en K™, entonces (^[G] = / _1 [(.g _1 y (g^ 1 o f)[G] es un abierto 

en K", porque g^ 1 o / es un isomorfismo y por consiguiente un homeomorfismo. 

Más aún, la aplicación || || : V — > IR dada por ||u| = ||/(u)|| es claramente 
una norma en V que induce la topología que acabamos de definir. Esto justifica 
las definiciones siguientes: 

Definición 1.68 Un isomorfismo topológico entre dos espacios vectoriales to- 
pológicos es una aplicación entre ambos que sea a la vez isomorfismo y homeo- 
morfismo. Si V es un K-espacio vectorial de dimensión finita n, llamaremos 
topología euclídea en y a la única topología respecto a la cual todos los isomor- 
fismos de V en K" son topológicos. 

Si h : V — > W es una aplicación lineal entre dos espacios vectoriales de 
dimensión finita, entonces es continua, pues considerando isomorfismos (to- 
pológicos) / : V — > K" 1 y g : W — > K" tenemos que la aplicación h' = 
/ _1 o h o g : K m — > K™ es lineal, luego continua, luego h = f o h' o g _1 también 
es continua. 

Si W es un subespacio de V, entonces la restricción a W de la topología 
euclídea en V es la topología euclídea. Para probarlo descomponemos V = 
W © W y observamos que la identidad de W con la topología euclídea a W con 
la topología inducida es continua por ser lineal y su inversa es continua por ser 
la restricción de la proyección de V en W, que también es lineal. Por lo tanto 
se trata de un homeomorfismo y ambas topologías coinciden. 

Similarmente se prueba que la topología euclídea en un producto de espacios 
vectoriales coincide con el producto de las topologías euclídeas. 

Todo subespacio W de un espacio vectorial de dimensión finita V es cerrado. 
Para probarlo observamos que W puede expresarse como el núcleo de una apli- 
cación lineal de W en K™, es decir, como la antiimagen de 0 por una aplicación 
continua y, como {0} es cerrado, su antiimagen también. 
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Todos estos hechos se trasladan sin dificultad a los espacios afines sobre 
K. Se define la topología euclídea en un espacio afín de modo que todas las 
afinidades son continuas y las variedades afines son cerradas. 

*Ejemplo: La topología proyectiva Un espacio proyectivo sobre K es de 
la forma X = P(V), donde V es un K-espacio vectorial de dimensión n + 1. 
Consideremos la aplicación P : V \ {0} — > X dada por P(v) = (v). Vamos 
a considerar en X la mayor topología que hace continua a P, es decir, los 
abiertos de X serán los conjuntos G C X tales que P _1 [G] es abierto en V 
(respecto a la topología euclídea). Es fácil ver que los conjuntos así definidos 
determinan realmente una topología en X. En lo sucesivo consideraremos a 
todos los espacios proyectivos como espacios topológicos con esta topología. La 
llamaremos topología proyectiva. Vamos a probar algunos hechos en torno a 
ella: 

La proyección P : V\{0} — > X es continua, abierta y suprayectiva. 

Sólo hemos de comprobar que es abierta. Sea G un abierto en V\{0}. Hemos 
de ver que G' = p-^PfG]] es abierto en V \ {0}. Es claro que G C G'. Sea 
v e G. Esto significa que existe un w € G tal que P(v) = P(w), luego v = aw, 
para un a £ K. La homotecia h(x) = ax es un homeomorfismo que transforma 
G en un entorno de v. Además h[G] C h[G'] = G' , luego G' es entorno de v. 

Las homografias entre espacios proyectivos son homeomorfismo s. 

Dada una homografía H : X — > Y, sea h : V — > W el isomorfismo que 
la induce, que de hecho es un homeomorfismo. Sean P : V \ {0} — > X y 
P' :W\ {0} — > Y las proyecciones que definen la topología. Entonces, si G es 
abierto en Y, por definición P' _1 [G] es abierto en H^\{0}, luego h^ 1 [P' _1 [G]\ es 
abierto en U\{0}, pero es fácil ver que este conjunto coincide con P^ 1 [ií _1 [G]] , 
luego ií _1 [G] es abierto, y el mismo razonamiento se aplica a la homografía 
inversa. 

Si E es un hiperplano de V que no pasa por 0, entonces P[E] es 
abierto en X y P\e ■ E — > P[E] es un homeomorfismo. 

Claramente P\e es inyectiva y continua. Basta probar que si A es abierto 
en E entonces P[A] es abierto en X. Sea B = P^ 1 [PL4]] . Basta ver que B es 
abierto en V \ {0}. Es claro que B = {av \ a € K \ {0}, v € A}. 

Escogiendo una base adecuada vi,. . . ,v n +i en V podemos suponer que E 
está formado por los vectores con última coordenada es x n+ \ = 1. Para cada 
v e V sea a(v) su última coordenada. La aplicación a es continua. Sea G el 
conjunto de vectores de V con a(v) ^ 0. Tenemos que G es abierto, pues su 
complementario es a -1 [{0}] . La aplicación G — > E dada por v ?T es 

continua y B es la antiimagen de A por esta aplicación, luego es abierto en G, 
luego en V \ {0}. 

Las subvariedades proyectivas de X son cerradas. 
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Dado un hiperplano E en V que no pase por 0, tenemos que el comple- 
mentario de P[E] es un hiperplano de X y, según lo que acabamos de probar, 
es cerrado. Como existe una nomografía que transforma un hiperplano en otro 
cualquiera, concluimos que todos los hiperplanos son cerrados y, como toda sub- 
variedad proyectiva es intersección de un número finito de hiperplanos, resulta 
que todas las subvariedades de X son cerradas. 

La topología inducida por X en una subvariedad proyectiva Y es la 
topología proyectiva de Y. 

Sea Y = P(W). Tomemos un punto y € F. Sea II un hiperplano en X que 
no contenga a y, sea II' = Y n II. Entonces una base de entornos de y para 
las topologías de X e Y son los abiertos que contienen a y y están contenidos 
en X \ II e Y \ II' respectivamente. Las topologías de estos espacios son las 
euclídeas, luego una es la inducida por la otra, luego los entornos básicos de 
y en Y son las intersecciones con Y de los entornos básicos de y en X. Por 
consiguiente, la topología proyectiva y la topología inducida tienen una misma 
base de entornos de cada punto, luego son iguales. 

Para terminar describiremos la topología de la recta proyectiva compleja. 
Tenemos que P 1 (C) = C U {oo}. La topología en C es la euclídea. Sólo falta 
determinar los entornos de oo. Como la aplicación 1/z es un homeomorfismo, 
una base de entornos de oo la forman las imágenes por 1 / z de los elementos de 
una base de entornos de 0, por ejemplo las bolas abiertas euclídeas de centro 0. 
Pero la imagen de B e (0) está formada por oo y los puntos z € C tales que \z\> 
1 /e, luego una base de entornos abiertos de oo la forman los complementarios 
de las bolas cerradas de centro 0. Es fácil ver entonces que un conjunto U es 
un entorno de oo si y sólo si oo € U y U \ {oo} está acotado. Esta misma 
descripción vale para los entornos de oo en P 1 (M). 

Ejercicio: Probar que las homografías entre cónicas y rectas son homeomorfismos. 

Ejemplo: La proyección estereográfica Consideremos la esfera de centro 
(0, 0, 0) y radio 1, es decir, el conjunto S = {(x, y, z) e IR 3 \ x 2 + y 2 + z 2 = 1}. 
Sea N = (0, 0, 1) el "polo norte" de S. 

La proyección estereográfica es la biyección entre S \ {N} y IR 2 que a cada 
punto P de S le asigna el punto donde la recta NP corta al plano z = 0 (que 
podemos identificar con IR 2 ). Si P tiene coordenadas (x, y, z), la recta NP 
está formada por los puntos (0,0, 1) + X(x, y, x — 1), con A € IR. El valor de 
A que anula la tercera coordenada es el que cumple 1 + A(z — 1) = 0, o sea, 
A = 1/(1 — z), luego la proyección de P es el punto 




Similarmente se calcula la proyección inversa, que es 
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Es evidente que tanto / como g son continuas, luego la proyección este- 
reográfica es un homeomorfismo. Así pues, el plano es homeomorfo a una esfera 
menos un punto. 

Equivalentemente, podemos decir que la esfera es homeomorfa al plano más 
un punto (extendiendo adecuadamente la topología). Conviene identificar el 
plano con el cuerpo complejo C. Añadamos a C un punto cualquiera que repre- 
sentaremos por oo, con lo que formamos el conjunto C°° = C U {oo}. Podemos 
extender la proyección estereográfica a una biyección / : S — > C°° sin más que 
asignar f(N) = oo. Es obvio que si tomamos como abiertos en C°° las imágenes 
por / de los abiertos de S obtendremos una topología en C°° que induce en 
C la topología euclídea. Vamos a dar una descripción directa de una base de 
entornos de oo. 

Para ello consideramos una base de entornos de N en S, concretamente la 
formada por las bolas de radio menor que 1. Un entorno básico de N está 
formado por los puntos (x, y, x) € S tales que i/a; 2 + y 2 + (z — l) 2 < e < 1, y 
como x 2 +y 2 + z 2 = 1, esto equivale az > 1 — e 2 /2. Puesto que e es arbitrario, los 
entornos básicos están formados por los puntos (x, y 7 z) G S tales que 1 — z < e, 
para e > 0. Calculemos la imagen de uno de estos entornos. 

Para ello notamos que si (x, y, z) ^ N, 



\f(x,y,z)\ = 

y que si z < z' entonces z — zz' < z' — zz' , luego 

z z' f 2z~ f 2?~~ ll + z 11 + z' 

— Z < —: V 1 + T^ < V 1+ w' s ¡—z < \—*- 

En otras palabras, cuanto mayor es z, mayor es la distancia a 0 de f(x, y, z). 
Por consiguiente, los puntos tales que z > 1 — e se corresponden con los puntos 
tales que 



\f(x,y,z)\ > \f(x,y,l-e)\ = 




Ahora bien, cualquier M > 0 es de esta forma para algún épsilon, concre- 
tamente e = 2/(M 2 + 1). Concluimos que los entornos básicos de oo son los 
conjuntos de la forma 

{zeC \ \z\ >M}U{oo}. 

Esto significa que un punto del plano está más cerca de infinito cuanto más 
lejos está de 0 (de hecho, cuanto más lejos está de cualquier punto concreto del 
plano) . ■ 

*Nota Obviamente C°° es la recta proyectiva compleja con la topología pro- 
yectiva. Otra forma de llegar al mismo resultado es la siguiente: Si consi- 
deramos la proyección estereográfica entre S y la recta proyectiva compleja, 
podemos expresarla como f(x, y, z) = ((x, y, 1 — z)), es decir, como la compo- 
sición de la aplicación continua (x, y, z) (x, y, 1 — z) con la aplicación con- 
tinua (x,y,z) i ^ ((x,y,z)), luego es continua. Podríamos probar también que 



/TT7 
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la inversa es continua, pero no merece la pena el esfuerzo, pues en el capítulo 
siguiente (ver 2.12) será evidente a partir de lo que ya hemos probado. La con- 
clusión es, pues, que la proyección estereográfica es un homeomorfismo entre la 
esfera con la topología euclídea y la recta compleja con la topología proyectiva. 

De aquí se sigue fácilmente que si dotamos al plano hiperbólico de la topo- 
logía relativa (es decir, si dotamos al plano de Klein con la topología euclídea) 
entonces la topología correspondiente en el círculo y en el semiplano de Poincaré 
es también la euclídea. Teniendo en cuenta que los círculos de centro 0 en el 
plano de Klein coinciden con los euclídeos (y que las isometrías son obviamente 
homeomorfismos) es claro que la esta topología es la inducida por la métrica 
hiperbólica. ■ 

1.6 Límites de funciones 

El concepto de límite es, junto al de continuidad, uno de los conceptos más 
importantes a los que la estructura topológica sirve de soporte. Para comprender 
su contenido podemos considerar la función / : M. 2 \ {(0, 0)} — > IR dada por 



Esta expresión no tiene sentido cuando (ce, y) — (0,0), por lo que es natural 
preguntarse si la gráfica de / mostrará alguna particularidad que explique por 
qué no puede ser calculada en este punto. He aquí dicha gráfica: 




Su aspecto es el de una superficie homeomorfa a M 2 , pero sabemos que no 
está definida en (0,0). De hecho la gráfica hace pensar que /(0,0) = 0. La 
explicación es que la función / : IR 2 — ► M. definida mediante 



es continua, aunque esto no es evidente y, de hecho, no estamos en condiciones de 
probarlo ahora. Si queremos expresar la situación en términos de la expresión 
original de /, no definida en (0,0), habremos de decir que / transforma los 
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puntos de alrededor de (0,0) en puntos de alrededor de 0, o también, que los 
valores que toma / son más cercanos a 0 cuanto más cercanos a (0, 0) son los 
puntos que consideramos. Todo esto tiene sentido aunque la función / no esté 
definida en (0, 0). 

Comenzamos introduciendo el concepto topológico que permite expresar con 
rigor las ideas que acabamos de introducir: 

Definición 1.69 Sean X, Y espacios topológicos, A C X y / : A — > Y. Sea 
a e A' y b € Y. Diremos que / converge a b cuando x tiende a a si para todo 
entorno V de b existe un entorno U de a tal que sixeUílAyx^a, entonces 



La interpretación es clara: los puntos f(x) están alrededor de b [= en un 
entorno arbitrario V de b] siempre que x está alrededor de a [= en un entorno 
adecuado U de a, que dependerá de V] , o más simplemente: si / envía los puntos 
de alrededor de a a los alrededores de b. 

Si Y es un espacio de Hausdorff, una función converge a lo sumo a un único b 
para cada punto a. En efecto, si / converge a dos puntos b y b' cuando x tiende a 
a, podríamos tomar entornos disjuntos V y V de b y 6', para los cuales existirían 
entornos U y U' de a de modo que si x € U fl U' fl A, entonces f(x) £ V fl V, 
contradicción. 

Por ello, si se da la convergencia, diremos que b es el límite cuando x tiende 
a a de f(x), y lo representaremos por 



No exigimos que la función / esté definida en a. Tan sólo que a sea un punto 
de acumulación del dominio de / o, de lo contrario, no existirían puntos x a los 
que aplicar la definición y / convergería trivialmente a todos los puntos de Y. 

En estos términos, lo que afirmábamos antes es que existe 



de modo que los valores que toma esta expresión se acercan más a 0 cuanto más 
se acercan las variables al punto (0,0). Todavía no podemos probarlo. 

Por supuesto es posible que la función / esté definida en a, pero esto es irrele- 
vante, pues en la definición de límite aparecen sólo puntos x ^ a, lo que significa 
que el límite es independiente de f(a). En otras palabras, si modificáramos el 
valor de /(a), la existencia del límite y su valor concreto no se alterarían. 

También es obvio que la existencia o no de límite sólo depende del compor- 
tamiento de la función en un entorno del punto. En otras palabras, que si dos 
funciones coinciden en un entorno de un punto a (salvo quizá en a) entonces 
ambas tienen límite en a o ninguna lo tiene y, si lo tienen, éstos coinciden. 



f(x) g V. 



b = lím f(x). 




La relación entre los límites y la continuidad es la siguiente: 
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Teorema 1.70 Sean X, Y espacios topológicos y f : X — > Y. Sea a e X' . 

Entonces f es continua en a si y sólo si existe lím f(x) = f(a). 

x—>a 

DEMOSTRACIÓN: Si el límite vale f(a), entonces la definición de límite se 
cumple trivialmente cuando x = a y lo que queda es la definición de conti- 
nuidad en a. Recíprocamente, la definición de continuidad de / en a implica 
trivialmente la definición de límite con b = /(a). ■ 

Mediante este teorema podemos deducir las propiedades algebraicas de los 
límites a partir de las propiedades correspondientes de las funciones continuas. 

Teorema 1.71 Sean f,g:AcX — > K dos funciones definidas sobre un 
espacio topológico X y sea a G A' . Si existen 

lím f(x) y lím g(x) 

x^a x^a 

entonces también existen 

lím (f(x) + g(x)) = lím f(x) + lím g(x), 

x — >a x — >a x — ►a 

lím f(x)g(x) = (lím f(x)) (lím g(x)) , 

x^a \x— >a / \x^a / 

„ f(x) l™ 1 ^ 

x^a g[x) lim g(x) 

x^a 

(suponiendo, además, en el tercer caso que lím g(x) ^ 0.) 

x—>a 

Demostración: La prueba es la misma en todos los casos. Veamos la 
primera. Consideramos la función /' que coincide con / en todos los puntos 
salvo en a, donde toma el valor del límite. Definimos igualmente g' . Entonces 
el teorema anterior implica que /' y g' son continuas en a, luego f' + g 1 también 
lo es, luego por el teorema anterior existe 

Vm(f(x)+g(x))=f(a) + ff(a), 

pero como /' + g' coincide con f + g salvo en a, el límite de /' + <?' coincide con 
el de / + g, y tenemos la relación buscada. ■ 

Es claro que el resultado sobre suma de límites es válido cuando las funciones 
toman valores en cualquier espacio vectorial topológico. Además en tal caso al 
multiplicar una función por un escalar el límite se multiplica por el mismo (para 
el caso de K esto es un caso particular de la segunda igualdad) . La misma técnica 
nos da inmediatamente: 

Teorema 1.72 Sea f : A C X — > X 1 x • • • x X n una aplicación entre espacios 
topológicos, que será de la forma f(x) = (/i(xi), . . . , f n (x)), para ciertas fun- 
ciones fi : X — > X¿. Sea a € A' . Entonces existe lím f(x) si y sólo si existen 

x—>a 

todos los límites lím fi{x) y en tal caso 

x^a 

lím f{x) = ( lím fi{x), lím f n (x) ) . 

x^a \x^a x^a / 
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Para calcular el límite que tenemos pendiente necesitamos un hecho que 
a menudo resulta útil. Diremos que una función / con valores en un espacio 
métrico está acotada si su imagen es un conjunto acotado. 

Teorema 1.73 Sean f, g : A C X — > E dos funciones definidas de un espacio 
topológico X en un espacio normado E y sea a € A' . Si existe lím f(x) = 0 y 

x^a 

g está acotada, entonces existe lím f(x)g(x) = 0. 

x—>a 

Demostración: Si g está acotada, existe un M > 0 tal que ||<7(a;)|| < M 
para todo x £ A. Entonces \\f{x)g{x)\\ < M||/(a;)||. El hecho de que / tienda 
a 0, sustituyendo los entornos en E de la definición general por bolas abiertas, 
queda así: 

Para todo e > 0 existe un entorno U de a tal que si x e U íl A y x ^ a, 
entonces ||/(x)|| < e. 

Tomamos ahora e > 0 y aplicamos este hecho a e/M, con lo que si x € U H A 
yi^o, tenemos que ||/(:r)g(a:)|| < M||/(x)|| < e, y esto significa que fg tiende 
a 0. ■ 

Ejemplo Se cumple 

lím x 2 | ; 2 - 1 | = 0, 

(*,»)-(o,o) ^ ^/x 2 + y 2 ) 

En efecto, basta probar que 

hm — , = 0, 

(x,y)^(0,0) y/x 2 + y 2 

pues el otro sumando, x 2 tiende obviamente a 0, por continuidad. Factorizamos 

2x 



\/x 2 + y 2 

El primer factor tiende a 0 y el segundo está acotado, pues se comprueba 
fácilmente que 

-1<_^=<1. 
y/x 2 + y 2 

Ahora basta aplicar el teorema anterior. ■ 

El hecho de que la composición de funciones continuas es continua se traduce 
ahora en el hecho siguiente: 

Teorema 1.74 Sea f : X — > Y y g : Y — > Z, sea a € X' y supongamos que 
existe 

lím f(x) = b 

x — >a 

y que g es continua en b. Entonces 

g (lím f(x)j = lím g(f(x)). 
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DEMOSTRACIÓN: Sea U un entorno de g(b). Entonces <7 _1 [C/] es un entorno 
de b. Existe un entorno V de a tal que si x € V, x ^ a, entonces f(x) in <7 _1 [Í7], 
luego g(f(x)) € U. Por lo tanto se cumple la definición de límite. ■ 

Por ejemplo, la continuidad de la raíz cuadrada implica que 



lím \x\J , =-1 = 0. 
(x,j/H(o,o) y y / x 2 + y 2 

Ejercicio: Dar un ejemplo que muestre la falsedad de la afirmación siguiente: Dadas 
dos funciones /, g : R — > R, si existen lím f(x) = b, lím g(a;) = c entonces existe 

x — >a x—>b 

también lím g(f(x)) — c. Probar que es cierta si f(x) ^ b para x / a. 



Limites restringidos El límite de una función en un punto depende del do- 
minio de ésta, por eso es importante lo que ocurre al restringir una función a 
dominios menores. Por ejemplo pensemos en la función / : R — > R dada por 

s _ J — 1 si x < 0 
I{X) ~\ 1 si x > 0 

Es claro que no tiene límite en 0, pero sí lo tienen las funciones /|]-oo,o[ Y 
/|]o,+oo[- Si consideramos sólo la parte de la izquierda de la función, resulta que 
es constante igual a —1, de donde su límite es —1. Igualmente el límite de la 
parte derecha es 1. Por ello definimos: 

Definición 1.75 Sea / : A C X — > Y, B C A y a € B' . Definimos 

lím l /O) = lím f\ B (x). 

B 

Para el caso de funciones definidas sobre subconjuntos de IR se define 
lím f(x)= lím f(x), lím f{x) = lím f(x), 

]— oo,a[ ]a,+oo[ 

y se llaman, respectivamente, límite por la izquierda y límite por la derecha de 
/ en a. También se les llama límites laterales. Su utilidad se debe al teorema 
siguiente: 

Teorema 1.76 Sea A un subconjunto de un espacio X y f : A — > Y. Supon- 
gamos que A = Bi U • • • U B n y que a es un punto de acumulación de todos estos 
conjuntos. Entonces existe lím f(x) si y sólo si existen los límites lím f(x) para 

x^a x^a 

Bi 

i = 1, . . . ,n y todos coinciden. En tal caso f{x) es igual al límite común. 

Demostración: Si existen tales límites y todos valen L, sea V un entorno 
de L. Por definición existen entornos C/¿ de a tales que si x £ Ui n {A n Bi) y 
x/a, entonces f(x) £ V. Si U es la intersección de los conjuntos Ui, entonces 
U es un entorno de a y si x G U íl A, x a, existirá un i tal que x € Bi, luego 
f(x) G V, es decir, lím f(x) — L. El recíproco es mas sencillo. ■ 
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Ejemplo Se cumple 



2 

lím x , / — , —1=0. 

(*,v)-(o,o) y Vx 2 + y 2 



Para comprobarlo calculamos los límites 



/ 2 , 2 
lím x / — 1 — lím \x\ / — 1 == 0 

(x,j/)^(o,o) y ^a; 2 + y 2 ' (*,i/)-(o,o) V x 2 + y 2 

x<0 V x<0 V 



lím x , / — . — 1 = lím Id , / — . —1 = 0, 

(*,»)-(o,o) y ^x 2 + y 2 (x,»)-(o,o) y ^/a; 2 + y 2 

y aplicamos el teorema anterior. 




Ejemplo: la proyección cónica Veamos ahora un caso en el que nos aparece 
de forma natural el cálculo de un límite. 

Consideremos de nuevo la esfera S y el cono 
C formado al unir el polo sur (0,0 — 1) con los 
puntos del ecuador de S. La figura muestra un 
corte transversal de S y C. Vamos a probar 
que S\ {N} es homeomorfo a una porción de C 
mediante la aplicación que traslada radialmente 
cada punto. 

Un punto (ir, y, z) de C está en el segmento que une el punto (0, 0, —1) con 
un punto (a, 6, 0), donde a 2 + b 2 = 1. Por tanto será de la forma 

(x, y, z) = (0, 0, -1) + X(a, 6,-1), con AgR. 

Entonces A = z + 1, luego x = a(z + 1), y = b(z + 1). De aquí se sigue que 

z + l = ±^x 2 + y 2 . 

Recíprocamente, si un punto cumple esta ecuación, si z = —1 ha de ser 
(0, 0, —1), que está en C, y si z ^ —1, entonces los valores 



A = z + 1, a = 



z + V 



b = 



y 



z + V 



permiten expresar a (x, y, z) en la forma paramétrica anterior, luego se trata de 
un punto de C. Nos interesa sólo la porción de C formada por los puntos con 
altura entre —1 y 1, por lo que definimos 

C = {(x,y,z) e R 3 | z + 1 = y/x 2 + y 2 7 -1 < z < l}. 
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Notar que los puntos con z = 1 no están en C. El homeomorfismo que bus- 
camos ha de transformar cada punto (x, y, z) de S\{N} en un punto (\x 7 Xy, z), 
donde A > 0 es el adecuado para llegar a C. La condición es 

^(Ax) 2 + {Xyf = z+l 

y, teniendo en cuenta que los puntos de la esfera cumplen ^ x 2 + y 2 = \J\ — z 2 , 

1 + z lí + z 



A V* 2 + y 2 Vi-2" 

Por lo tanto f : S \ {N} — > C será la aplicación dada por 



fu- <)■ :) = ( \l\^ x 'VY^- z y> z 



La inversa se calcula sin dificultad a partir de esta expresión: 



g(x,y,z) = \J\^ Z X ^Y^- Z V^ Z J ' si 0>í/> z ) + (0,0,-1), 

y por supuesto g(0, 0, —1) = (0, 0, —1). 

Obviamente / es continua. Lo mismo vale para g en todos los puntos salvo en 
(0, 0, —1). Para probar la continuidad en este punto hacemos uso de la igualdad 
1 + z = \Jx 2 + y 2 , que cumplen todos los puntos de C, la cual nos permite 
expresar g como 



Basta probar que 



lf m .A x \¡ rj=^ ~^ Vi rí^ -^A =(0,0,-1), 



(x,y,z)^(0,0-l) y y ^Jx 2 _|_ yl ' y y/x^+y 2 

pero los dos primeros límites son el que hemos calculado como ejemplo a lo largo 
de la sección. 

Así pues, / es un homeomorfismo entre S \ {N} y C. Ahora bien, es in- 
mediato comprobar que la proyección sobre el plano XY es un homeomor- 
fismo entre C y la bola abierta de centro 0 y radio 2 (la aplicación inversa es 
(x, y) i > (x,y,—l + \Jx 2 + y 2 ), claramente continua), con lo que la composición 
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es un homeomorfismo entre S \ {N} y dicha bola. Más aún, si componemos 
la inversa de la proyección estereográfica con esta aplicación obtenemos un ho- 
meomorfismo entre IR 2 y el disco abierto. Es fácil ver que la composición es 



t(x,y) 



2x y/x 2 + y 2 2y \/x 2 + y 2 
x 2 + y 2 + 1 ' x 2 + y 2 + 1 



Si quitamos los doses obtenemos un homeomorfismo t : IR 2 — > D, donde D 
es la bola abierta (euclídea) de centro 0 y radio 1. Concretamente: 



t(x,y) 



\Jx 2 + y 2 y\Jx 2 + y 2 



x 2 + y 2 + 1 x 2 + y 2 + 1 



Si restringimos esta aplicación a IR, es decir, a los puntos (x, 0) obtenemos 
un homeomorfismo entre IR y el intervalo ] — 1, 1[. Concretamente 



t(x) 



x\x\ 
x 2 + l 



He aquí su gráfica: 




Si lo restringimos a ]0, +oo[ obtenemos un homeomorfismo entre este inter- 
valo y ]0, 1[. A saber: 

t(x) 



x 2 + 1 



A partir de aquí es fácil ver que dos intervalos abiertos cualesquiera (acotados 
o no) son homeomorfos. ■ 



Límites infinitos Consideremos ahora límites de funciones con valores en 
R = IR U {— oo, +00} o en C°° = C U {00}. Recordando que los entornos básicos 
de +00 son los intervalos ]M, +00], es claro que 

lím f(x) = +00 

significa que para todo M > 0 existe un entorno U de a tal que si x G U, x ^ a 
está en el dominio de /, entonces f(x) > M . Similarmente ocurre con —00. 
Que el límite valga 00 significa que para todo M > 0 existe un entorno U de a 
tal que si x G U, x ^ a está en el dominio de /, entonces |/(x)| > M. 

Es fácil probar que los teoremas del estilo de "el límite de la suma es la suma 
de los límites" etc. valen también en los casos siguientes: 



+00 + (+00) = +00, —00 + (—00) = —00, 
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+00 + a = +00, —00 + a =—00, oo + a = oo, 
(+00) (+00) = +00, (— 00) (— 00) = +00, 0000 = 00. 
si a > O, (+oo)a = +00, (— oo)a = —00; 

si a < O, (+oo)a = —00, (— oo)a = +00. 

a a a 

Si a O, 00 a = 00, = — = 0. - = 00. 

±00 00 O 

Por ejemplo, la igualdad +00 + (+00) = +00 es una forma de expresar que 
la suma de dos funciones f,g:AcX — > R que tienden a +00 en un punto 
a e A', tiende también a +00. La prueba es sencilla: dado un M > 0 existen 
entornos U y V de a tales que si a; € UílA' entonces f(x) > M/2 y si x £ V^flA' 
entonces > M/2, con lo que sixGC/nV^n^l entonces /(x) + g(x) > M, 
luego se cumple la definición de límite. Similarmente se prueban todas las 
demás. 

Cálculo de límites Estudiamos ahora los límites más simples y frecuentes. 
Comencemos con los límites en infinito de los polinomios. Obviamente 

lím x = ±00. 

x — >±oo 

Aplicando n veces la regla (+00) (+00) = +00 vemos que si n > 0 entonces 

lím x n = +00. 

El límite en —00 será obviamente (—1)™ 00. Si n < 0 usamos la regla l/±oo = 0 
y si n = 0 tenemos que x° es la constante 1, luego en total: 

Í+oo si n > 0, 
1 si n = 0, 
0 si n < 0. 

El límite en —00 difiere sólo en el primer caso, de forma obvia. 
Para calcular el límite de un polinomio multiplicamos y dividimos por la 
potencia de x de mayor grado: 

(312 
8 h ^7 + — r - -tí ) = +00. 
X X z X 4 x° 

En general, si p(x) € R[x] no es constante, se cumple lím P(x) = ±00, 

x — »±oo 

donde el signo depende en forma obvia del signo del coeficiente director de P 
y de la paridad del grado si tendemos a —00. En C°° todos los polinomios no 
constantes tienen límite 00. 



En particular vemos que, a diferencia de casos como l/oo o +00 + 00, no 
hay una regla general para calcular un límite de la forma +00 — 00. En efecto, 
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los tres límites siguientes son de este tipo y cada uno da un resultado distinto. 
Por ello se dice que +oo — oo es una indeterminación. 

lím x 5 — x 2 = +oo, lím x 2 — x 5 = — oo, lím (x + 2) — (x + 1) = 1. 

x— *+oo x— *+oo 2^+00 

Nos ocupamos ahora de los límites de fracciones algebraicas (cocientes de 
polinomios). El ejemplo siguiente ilustra el caso general: 

6x 4 -3x 3 + x + l 6 -| + í3+í4 6 „ 

1™ 7T~a ñ 7. 7 = 1™ f % V = - = 3. 

2x 4 + x 2 -2x + 2 2+ \ - \ + \ 2 

X ¿ X- 1 X 4 

Es claro que el límite en ±00 del cociente de dos polinomios del mismo grado 
es el cociente de los términos directores. Si los grados son distintos, al dividir 
entre la potencia de mayor grado obtenemos 0 si el grado del denominador es 
mayor y ±00 si es mayor el del numerador, donde el signo se calcula de forma 
obvia. Esto vale igualmente (salvo lo dicho de los signos) para límites en C°° . 

Vemos, pues que el caso 00/00 es también una indeterminación. 

Por ejemplo, antes hemos probado que la función 



x\x\ 

1 



es un homeomorfismo entre IR y el intervalo ] — !,![. Ahora es claro que 



lím = ±1, 

x— >±oo 



luego si definimos £(±00) = ±1 tenemos una biyección continua t : R — > [—1, 1]. 
En el capítulo siguiente veremos que es un homeomorfismo. 

Ejercicio: Calcular í _1 y probar que es continua. 



1.7 Convergencia de sucesiones 

Si los límites de funciones tienen especial interés en el cálculo diferencial, en 
topología son más importantes los límites de sucesiones, que en realidad son un 
caso particular de los primeros. 

Definición 1.77 Una sucesión en un conjunto X es una aplicación a : N — > X. 
Se suele representar {a„}^L 0 o, más gráficamente: 

ao, ai, ü2, 03, ... a n , 

En realidad, lo único que nos interesa de una sucesión es el orden en el 
que se suceden sus elementos, y no la numeración que éstos reciben. Por ello 
en la práctica admitiremos sucesiones que comiencen en índices mayores de 0. 
Por ejemplo, la sucesión {n}^L 0 Y ^ a sucesión {n — 7}^ =0 son conjuntistamente 
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distintas, pero para nosotros serán la misma sucesión, la sucesión de los números 
naturales. 

Por simplicidad, en teoría hablaremos siempre de sucesiones {a„}™ =0 , aun- 
que en la práctica comenzaremos a partir del índice que más convenga. 

La razón por la que estas diferencias no nos van a afectar es que sólo nos van 
a interesar las propiedades finales de las sucesiones. Diremos que una sucesión 
{«nj^Lo cumple finalmente una propiedad si existe un n 0 € N tal que a n cumple 
la propiedad para todo n > n 0 . 

Por ejemplo, una sucesión es constante si todos sus términos son iguales a 
un cierto elemento x. Una sucesión es finalmente constante si es constante a 
partir de un término. La sucesión siguiente es finalmente igual a 5: 

3, 1, -2, 8, 5, 5, 5, 5, 5, 5, ... 

Una subsucesión de {dnj^Lo es una sucesión de la forma {ci nk } < kLo, donde 
{ n fc}feLo es una sucesión estrictamente creciente de números naturales, es decir, 
si k < k' , entonces nu < tiy . 

Una observación útil es que en estas condiciones siempre se cumple k < n^. 
Se prueba fácilmente por inducción sobre k. 

Definición 1.78 Sea X un espacio topológico, l € X y {a n }^ =0 una sucesión 
en X. Diremos que a n converge a l si está finalmente en todo entorno de l, o 
sea, si para cada entorno V de l existe un n 0 € N tal que a n € V para n> n 0 . 

Así pues, una sucesión converge a un punto / si está finalmente alrededor 
de l, es decir, si todos sus términos salvo un número finito están en cualquier 
entorno de / prefijado. 

Si X es un espacio de Hausdorff y {a n }$ÍLo converge en X, entonces el punto 
al cual converge es único, pues puntos distintos tienen entornos disjuntos, y una 
sucesión no puede estar finalmente en dos conjuntos disjuntos. Representaremos 
por 

lím a n 

n 

al único límite de la sucesión {a n }^ =0 en un espacio de Hausdorff, cuando éste 
exista. 

Veamos ahora que esta noción de límite es un caso particular del que hemos 
estudiado en la sección anterior. Consideremos N°° = NU {oo} con la topología 
inducida desde C°° . Es fácil ver que la topología en N es la discreta y una base 
de entornos de oo la forman los conjuntos {n G N | n > n 0 } U {oo}. En estos 
términos, una sucesión {o„}^L 0 converge a un punto Z si y sólo si para todo 
entorno U de l existe un entorno V de oo tal que si n € V, n ^ oo entonces 
a n e U, es decir, si y sólo si la sucesión, vista como función N — > X converge 
a l cuando n tiende a oo. En tal caso 

líma„ = lím a n . 

Sabiendo esto, todos los resultados generales para límites de funciones valen 
para sucesiones, por ejemplo, el límite de la suma de dos sucesiones de números 
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reales es la suma de los límites, etc. Veamos ahora algunos hechos específicos 
sobre sucesiones: 

Una sucesión converge si y sólo si converge finalmente, es decir, 
{ a n}$ÍLo converge a l si y sólo si la sucesión {a n }^ =k converge a l. 
En particular, las sucesiones finalmente constantes convergen. 

(Esto es consecuencia de que el límite de una función en un punto — el 
punto oo en este caso — depende sólo del comportamiento de la función en un 
entorno del punto). 

Si A C X, {a„}^L 0 C A y l € A, entonces {a n }^ =0 converge a l en 
A si y sólo si converge al en X. 

(Pues los entornos de l en A son las intersecciones con A de los entornos de 
l en X y, como la sucesión está en A, es equivalente que esté finalmente en un 
entorno de I en A o que esté finalmente en un entorno de l en X.) 

Este hecho nos dice que la convergencia depende exclusivamente de la su- 
cesión y de su límite, y no del espacio en el que los consideremos (siempre que no 
cambiemos de topología, claro está). Sin embargo, también de aquí se desprende 
que una sucesión convergente deja de serlo si eliminamos su límite. Por ejemplo, 
la sucesión {l/n}%L 0 no converge en el espacio ]0, 1], pues si convergiera a un 
punto l, tendríamos que en R debería converger a la vez a l y a 0. 

Si una sucesión converge a un punto l, entonces todas sus subsuce- 
siones convergen a l. 

Pues si {a n }^L 0 converge a l y {a nfc }^L 0 es una subsucesión, para todo 
entorno U de l existe un no tal que si n > no se cumple a n <G U, pero si k > no 
entonces n^ > k > no, luego a rik € U. 

Ejercicio: Demostrar que una sucesión {x n }%L 0 converge en un espacio producto 
Y[ Xi a un punto x si y sólo si las sucesiones {a;™}^L 0 convergen a Xi para todo i £ I. 

iei 

No podemos continuar nuestro estudio de las sucesiones sin introducir un 
nuevo concepto. Sucede que las sucesiones no se comportan adecuadamente en 
todos los espacios topológicos, sino sólo en aquellos que cumplen la siguiente 
propiedad adicional, por lo demás muy frecuente: 

Definición 1.79 Un espacio X cumple el primer axioma de numerabilidad 
(1AN) si para todo punto x G X existe una base de entornos de x de la forma 
{K}~ 0 . 

Esta propiedad la tienen todos los espacios métricos, pues si x es un punto 
de un espacio métrico, una base de entornos de x la forman los conjuntos 
{B 1 / n (x)}^ =1 . Así pues, todos los espacios que manejamos cumplen 1AN. En 
el caso de C°°, en lugar de considerar la métrica inducida desde la esfera, es 
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más fácil considerar directamente la base de entornos de oo formada por los 
conjuntos siguientes: 

E n = {z e C | \z\ > n} U {oo}, para n = 1, 2, . . . 

En IR, una base de entornos de +oo es {]n, +oo]}}^ 0 y una base de entornos 
de — oo es { [— oo, n[}}^ 0 , luego este espacio también cumple 1AN. 

Observemos que si X es un espacio que cumple 1AN y x € X, podemos 
tomar una base de entornos de x de la forma {V n }^ =0 que cumpla además 

Vq D Vx d v 2 d v 3 d ... 

Si una base dada {W n }%L 0 no lo cumple, tomamos V n = Wq fl ■ ■ ■ ("1 W n y así 
tenemos las inclusiones indicadas. Todas las bases de entornos de los ejemplos 
que acabamos de dar son decrecientes en este sentido. 

Consideremos ahora esta sucesión: 

1, -1, 1, -1, 1, -1, 1, -1, 1, -1, 1, -1, ... 

Es obvio que no es convergente, pero sin duda hay dos puntos "especiales" 
para esta sucesión, el 1 y el —1. Quizá el lector se sienta tentado de afirmar que 
se trata de una sucesión con dos límites, pero nuestra definición de límite no 
admite esa posibilidad. Vamos a dar una definición que describa esta situación. 

Definición 1.80 Un punto x de un espacio topológico X es un punto adherente 
de una sucesión {a n }^ =0 en X si para cada entorno V de x y cada número 
natural n existe un número natural m > n tal que a m G V. 

Es decir, si la sucesión contiene puntos arbitrariamente lejanos en cualquier 
entorno de ce o, si se prefiere, si la sucesión contiene infinitos puntos en cada 
entorno de x. 

En estos términos, la sucesión {(— l) n }^ =0 que hemos puesto como ejemplo 
tiene exactamente dos puntos adherentes, 1 y —1. 

Teorema 1.81 Sea X un espacio 1AN. Un punto x G X es un punto adherente 
de una sucesión {a n }^L 0 si y sólo si ésta contiene una subsucesión que converge 
a x. 

Demostración: Si x es un punto adherente de la sucesión, sea {Vn}^L 0 
una base decreciente de entornos de x. Existe un punto a no € V 0 - Existe un 
natural ni > n 0 + 1 tal que a ni € V\. Existe un natural n 2 > n\ + 1 tal que 
o„ 2 £ Vá. De este modo obtenemos una subsucesión {a„ fc }^L 0 tal que cada 
a n k € Í4 y, como la sucesión de entornos es decreciente, en realidad Í4 contiene 
todos los términos de la subsucesión posteriores a a nk , luego la subsucesión que 
hemos obtenido está finalmente en cada entorno 14, es decir, converge a x. 

Recíprocamente, si hay una subsucesión que converge a x, dicha subsucesión 
está finalmente en cualquier entorno de x, luego dicho entorno contiene infinitos 
términos de la sucesión dada. ■ 
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En particular vemos que una sucesión convergente no tiene mas punto ad- 
herente que su límite. 

La continuidad de funciones puede caracterizarse en términos de sucesiones: 

Teorema 1.82 Sea f : X — > Y una aplicación entre espacios topológicos y 
supongamos que X cumple 1AN. Sea x € X. Entonces f es continua en x 
si y sólo si para cada sucesión {a„}^L 0 c X tal que líma„ = x, se cumple 

n 

Iím/(a„) = /O). 

n 

DEMOSTRACIÓN: Supongamos que / es continua en x. Sea V un entorno de 
f(x). Entonces es un entorno de a; y la sucesión {a n }^L 0 está finalmente 

en / _1 [V], luego {/(a n )}^Lo est á finalmente en V, o sea, lím/(a„) = f(x). 

n 

Recíprocamente, supongamos que / no es continua en x. Entonces existe 
un entorno V de f(x) tal que no es entorno de x. Sea {V n }^L a una 

base decreciente de entornos de x. Para cada natural n, no puede ocurrir que 
V n C / _1 [V], luego existe un punto a n € V n tal que f(a n ) £ V. 

Como la base es decreciente, todos los términos posteriores a a n están en 
V n , luego la sucesión {a n }^ =0 está finalmente en cada V n , con lo que converge 
a x. Sin embargo la sucesión {/(a„)}^L 0 no tiene ningún término en V, luego 
no converge a f(x). m 

Los puntos adherentes se caracterizan por sucesiones: 

Teorema 1.83 Sea X un espacio topológico que cumpla 1AN. Sea A C X. En- 
tonces A está formado por los límites de las sucesiones convergentes contenidas 
en A. 

DEMOSTRACIÓN: Si l es el límite de una sucesión contenida en A, entonces 
todo entorno de l contiene puntos de la sucesión, es decir, puntos de A, luego 
le A. 

Recíprocamente, si x e A, tomamos una base decreciente {V„}^ 0 de en- 
tornos abiertos de x. Como V n n A ^ 0, existe un a n € V n n A y la sucesión 
i a n}^ = o así construida converge ai, y está contenida en A. m 

En particular, un conjunto A es cerrado si y sólo sí el límite de toda sucesión 
convergente contenida en A, está en A, es decir, si no es posible "salir" de A 
mediante sucesiones. 

Veamos cómo puede aplicarse este hecho: supongamos que una sucesión de 
números reales cumple lím a n = l y a n < 5 para todo n. Entonces la sucesión 

n 

está contenida en el intervalo cerrado ]— oo, 5], luego su límite también, es decir, 
podemos concluir que l < 5. 

Ejercicio: Probar que si dos sucesiones convergentes de números reales cumplen 
ffln < b n para todo n, entonces líma„ < límfo n . 
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1.8 Sucesiones y series numéricas 

Vamos a estudiar algunos casos concretos de límites de sucesiones en K. 
Consideremos en primer lugar la sucesión {r n }^ =0 , donde r £ R. Vamos a 
calcular su límite. 

Supongamos primero que r > 1. Sea s = r — 1 > 0. Entonces r = 1 + s y 
por el teorema del binomio de Newton 



k=2 ^ 



s k > ns. 



Sabemos que límns = +oo. Del hecho de que {ns}%L 0 esté finalmente en 

n 

cada entorno básico de +oo, de la forma ]M, +oo], se sigue claramente que lo 
mismo le sucede a {r™}^L 0 , luego si r > 1 concluimos que límr" = +oo. 

n 

Si r = 1 es obvio que lím r™ = 1 . 

n 

Si 0 < r < 1 entonces 

límr™ = lím \ , = — = 0. 

n n (\/r) n OO 

Si r = 0 es obvio que límr™ = 0. 

n 

En lugar de analizar ahora el caso r < 0 consideraremos en general r€K. 
Si |r| > 1, entonces lím|r™| = lím|r|™ = +oo, de donde es fácil deducir a 

n n 

partir de las meras definiciones que límr™ = oo. 

n 

Si |r| < 1, entonces lím |r™| =0, de donde también se sigue que límr™ = 0. 

n n 

Puede probarse que si |r| = 1 el límite no existe salvo en el caso r = 1. Por 
ejemplo, ya hemos visto que lím(— 1)™ no existe, pues se trata de la sucesión 

n 

1,-1,1,-1,1,-1,... 

Definición 1.84 Una sucesión {a„}^L 0 es monótona creciente si m < n implica 
a m < a n . La sucesión es estrictamente creciente si cuando m < n entonces 
a m < a n . Igualmente se definen las sucesiones monótonas decrecientes y las 
sucesiones estrictamente decrecientes. Una sucesión es monótona si cumple 
cualquiera de estas cuatro propiedades. 

El interés de las sucesiones monótonas estriba en que podemos probar que 
son convergentes sin necesidad de calcular su límite. Esta clase de resultados 
de convergencia proporcionan la técnica más importante para definir números 
reales, expresándolos como límites de sucesiones sencillas. 

Teorema 1.85 Toda sucesión monótona creciente converge a su supremo en 
M., y toda sucesión monótona decreciente converge a su ínfimo en R. 

Demostración: Por supremo de una sucesión {a n }^L 0 entendemos el su- 
premo del conjunto {a n | n € N}. Sea s este supremo y supongamos que es 
finito. Entonces un entorno básico de s es de la forma ]s — e, s + e[, para un 
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e > 0. Como s — e no es una cota superior de la sucesión, existe un natural m 
tal que s — e < a m < s y, por la monotonía, s — e < a n < s para todo n > m, 
es decir, que la sucesión está finalmente en el entorno. Una ligera modificación 
nos da el mismo resultado si s = +oo o si la sucesión es decreciente. ■ 

Prestaremos ahora atención a un tipo especial de sucesiones de particular 
interés. Se trata de las llamadas series numéricas. 

Definición 1.86 Llamaremos serie determinada por una sucesión {a n }^ =0 en 

( k }°° 00 
K a la sucesión < a « f -La representaremos por ^ a„ o, más gráfica- 

ln=0 J k=0 n=0 

mente, por 

a 0 + ai + a 2 + a 3 + a 4 + a 5 + 
k 

Los términos a " se llaman sumas parciales de la serie. Si es convergente, su 

n=0 

oo 

límite se llama suma de la serie y se representa también por a n- Esto nunca 

n=0 

lleva a confusión. 

Así pues, una serie es una suma con infinitos sumandos. Una serie de 
términos positivos es, como su nombre indica, una serie en K tal que todos los 
términos a n son positivos. Vista como sucesión, una serie de términos positivos 
es estrictamente creciente, luego converge en R. De todos modos es costumbre 
llamar divergente a una serie cuya suma sea +oo. 

Una progresión geométrica es una sucesión en la que cada término se obtiene 
del anterior multiplicándolo por un número fijo llamado razón. Por lo tanto, 
si el primer término de una progresión geométrica es üq y la razón es r, los 
términos siguientes serán ai = a 0 r, a 2 = a 0 r 2 , a 3 = a 0 r 3 , ... y, en general, 
a n = a 0 r n . 

Una serie geométrica es una serie asociada a una progresión geométrica, o 

oo 

sea, una serie de la forma ar ™ ■ 

n=0 

Una suma parcial es de la forma 

a(l + r + r 2 H h r n ). 

Es conocida la identidad 

r" - 1 = (r - 1)(1 + r + r 2 + ■ ■ ■ + r™" 1 ), 
luego si r t¿ 1 tenemos que 

a(l + r + r 2 + 



+ r n ) = 



ar n+l _ a a _ ar n+l 



r - 1 



1 -r 
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y de aquí, 

E n a-ar n+L 
ar n = hm — . 
n 1 - r 

n—l 

Si \r\ > 1 sabemos que lím ar n+1 = oo, de donde se sigue que la serie diverge. 

n 

Por otro lado, si \r\ < 1, entonces lím ar n+1 = 0, luego 



oo 

1 - r 



n=l 



Por ejemplo: 



11111 \ 

— I 1 1 1 V ■ ■ ■ = — - — = 1 

2 4 816 32 1 - i 

Así pues, las series geométricas convergen cuando la razón tiene módulo 
menor que 1, y su suma es el primer término dividido entre 1 menos la razón. 

Ejemplo: expansiones decimales Es conocido que todo número natural n 

r 

puede expresarse de la forma n = a¿10 4 , donde a 0 , ai, . . . , a r son números 

¿=i 

naturales menores que 10. Además, para n ^ 0 la expresión es única si exigimos 
a r ^ 0. De hecho usamos esta expresión para nombrar a cada número natural, 
por ejemplo 

4.275 = 4 • 10 3 + 2 • 10 2 + 7 • 10 1 + 5 • 10°. 
Más en general, dado un número natural k > 2, todo número natural puede 

r 

expresarse en la forma a ik l , donde ao, ai, . . . , a r son números naturales me- 

¿=o 

ñores que k. 

Vamos a extender esta notación para nombrar a ciertos números racionales. 
En lo sucesivo, una expresión como ésta: 23,472 representará al número 

2 • 10 1 + 3 • 10° + 4 • 10" 1 + 7 • 10~ 2 + 2 • 10~ 3 . 

Es decir, del mismo modo que el 2 se interpreta multiplicado por 10, el 
primer número a la derecha de la coma se considerará dividido entre 10, el 
segundo entre 100, etc. De este modo, los números 

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 

dividen al intervalo unidad en 10 partes iguales. Cada una de estas partes se 
divide a su vez en 10 partes añadiendo una cifra más, por ejemplo: 

0,3 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,4 

es una división del intervalo [0, 3 , 0,4] en 10 partes iguales. 
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Por supuesto podemos usar otras bases diferentes de 10. Por ejemplo, en 
base 10 tenemos que 1/2 = 5/10 = 0, 5. En base dos, en cambio, 1/2 = 0, 1. 

Los números racionales expresables de esta forma se llaman números deci- 
males exactos. 

Tomemos ahora un número natural k > 2 y sea {a n }^ =1 una sucesión de 
números naturales menores que k. Entonces 

r r oo 1 

Y a » fc ~" ^ o - !) Yl k ~ n < o - x ) X! k ~ n = ( fc - l )^r = L 

n=l n=l n=l k 

oo 

Por lo tanto, el supremo de las sumas parciales de Y a nk~ n es menor o 

n=l 

oo 

igual que 1, luego 0 < Y a nk~ n < 1. 

n=l 

Esto nos permite extender nuestros desarrollos decimales hasta admitir un 
número infinito de cifras. Por ejemplo: 532, 11111. . . representa al número 

5 • 10 2 + 3 • 10 1 + 2 • 10° + 1 • 10" 1 + 1 • 10" 2 + 1 • 10~ 3 + 1 • 10~ 4 + • • • 

Como f] 10-™ = 1/9, tenemos que 532, 11111. ..= 532 + 1/9. 

Notar que las sucesiones finalmente nulas nos dan los decimales exactos: 

3,67 = 3,6700000... 

El interés de usar infinitas cifras decimales es que todo número real positivo 
es expresable mediante uno de estos desarrollos, es decir, si k es un número 
natural mayor o igual que 2, todo número real positivo x se puede escribir como 

r oo 
n—0 n—1 

donde los coeficientes son números naturales menores que k. 

Vamos a probarlo para k = 10 y x = \¡2, aunque el procedimiento es com- 

r 

pletamente general. La parte b n k n del desarrollo buscado no es sino el 

n=0 

desarrollo decimal de la parte entera de x. En nuestro caso, como 1 < 2 < 4, 
resulta que 1 < \/2 < 2, luego la parte entera es 1. 

Dividimos el intervalo [n, n + 1] en el que se encuentra x en 10 partes, que 
en nuestro caso son 

1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2 

Nuestro número x debe estar en uno de los 10 intervalos. En nuestro caso, 
como 



(1,0) 2 

(M) 2 

(1,2) 2 

(M) 2 
(1,4) 2 


= 1 


(1.5) 2 

(1.6) 2 

(1.7) 2 


= 2,25 


= 1,21 


= 2,56 


= 1,44 


= 2,89 


= 1,69 


(1,8) 2 


= 3,24 


= 1,96 


(1,9) 2 


= 3,61 
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resulta que (1, 4) 2 < 2 < (1, 5) 2 , luego 1, 4 < \/2 < 1, 5. Procediendo del mismo 
modo podemos ir obteniendo las desigualdades siguientes: 

1 < V2 < 2 

1,4 <V2< 1,5 

1,41 <V2< 1,42 

1,414 <v / 2< 1,415 

En general, la n-sima cifra se obtiene como la máxima que hace que el 
decimal exacto correspondiente sea menor o igual que x. Ahora probemos que 
la sucesión así obtenida converge a x, es decir, probemos que 

V2 = l, 4142135623730950488016887. . . 

No olvidemos que S = 1, 4142135623730950488016887. . . es por definición la 
suma de una serie cuyas sumas parciales son 1; 1, 4; 1, 41; 1, 414. . . 

Por construcción cada suma parcial es menor que \/2, luego la suma de la 
serie, que es el supremo de dichas sumas, cumple S < \¡2. 

Ahora bien, tenemos que 1 < S < \¡2 < 2, luego la distancia \\/2 — S\ < 
|2 - 1| = 1. Igualmente 1, 4 < S < V2 < 1, 5, luego |-y/2 - S\ < |1,5 - 1,4| = 
0,1 = 1/10 y, del mismo modo, 1,41 < S < V% < 1,42, luego | a/2 - S\ < 
|1, 42 - 1,41| = 0,01 = 1/100. 

En general concluimos que 0<\V2-S\< 10-" para todo número natural 
n. Como la sucesión 10~" tiende a 0 concluimos que 0 < |\/2 — S\ < e para 
todo e > 0, lo cual sólo es posible si |\/2 — S\ = 0, o sea, si S = \¡2. 

Esto prueba también que al truncar un número real (es decir, al quedarnos 
con un número finito de sus decimales) obtenemos una aproximación tanto mejor 
cuantas más cifras conservemos. Por ejemplo, el número racional 1,4142 no es 
a/2, pero se diferencia de \¡2 en menos de 1/10000. Su cuadrado no es 2, 
obviamente, pero es 1,99996164, que dista de 2 menos de 1/10000. En muchas 
ocasiones y a efectos prácticos esto es más que suficiente. 

Es importante notar que los desarrollos no son únicos, pues por ejemplo es 
claro que 

1 = 0,99999...; 0,1 = 0,099999...; 0,01 = 0,0099999... 

En general, si una sucesión {a n }^ =1 es finalmente igual a k — 1 (digamos a 
partir de a„), entonces 

0, aia2- ■ ■ a n -i(k - l)(k - í)(k - 1). . . = 0, aiet 2 - . . a n - 2 (a n -i + 1), 

pues 

00 k - 1 

0,aia 2 . ..a„_i(fc - l)(fc - l)(fc - 1). . .= 0,aia 2 . . .a„_i + ^ 

r—n 

= 0,ai« 2 - • -a n _i + = 0,aia 2 . . .a n - 2 (a n -i + 1). 
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O sea, toda expresión finalmente igual a k — 1 admite una expresión exacta 
sumando 1 a la cifra anterior al primer k — 1 de la cola constante. 

Si no admitimos sucesiones finalmente iguales a k — 1 el desarrollo es único. 
En efecto, supongamos que 0, ai 0,2- . . = 0, bib 2 . . . Sea a n ^ b n la primera cifra 
diferente. Digamos que a n <b n . Tenemos que 

oo oo 

0, a\ü2- ■ ■ Cb n -i + ^2 b r k~ r = 0, aiü2- ■ ■ a n — 1 + a r fc~' , 

r—n r—n 

luego 

, oo oo oo 

f + E & ^ r = F+ E a ^ r <F+ E ( fc -!) fc - r = ^ + ¿- 

r— n+1 r— n+1 r— n+1 

Notar que la desigualdad es estricta porque no todos los a r son iguales a k — 1 
(no aceptamos desarrollos finalmente iguales a fc — 1). Por lo tanto b n < a n + 1, 
o sea, b n < a n , contradicción. 

El algoritmo de Euclides para dividir números naturales es válido para calcu- 
lar el desarrollo decimal de cualquier número racional: 

1,0000001 7 



1 0 0,142 84 

30 
20 
60 
30 
2 

Así pues, 1/7 = 0,1428428428428... La razón por la que el algoritmo es 
válido es que los cálculos que realizamos pueden expresarse de un modo menos 
práctico, pero conceptualmente más claro, de la forma siguiente: 

1 „ 1 n 1 10 n 1 í-, 3\ n 1 1 30 

7 = 0+ 7^ 0+ n)-y^ 0+ n)-( 1 + 7j^ 0+ n)-Too-y 

= 0+1. 4-^+^=0+1. 4-4- 1 20 



10 100 v 7/ io 10° i- 000 7 

Una consecuencia importante es que, como los restos posibles son un número 
finito, tras un número finito de pasos hemos de obtener un resto ya obtenido 
previamente, y como cada cifra del cociente depende exclusivamente del último 
resto, resulta que las cifras se repiten cíclicamente. En el caso de 1/7 el grupo 
de cifras que se repite es 428. Para indicar esto se suele usar la notación 1/7 = 

0, 14 428. 

El bloque 428 se suele llamar período del número. El bloque de cifras deci- 
males previas al período (que puede no existir) se llama anteperíodo (1 en este 
caso) , luego en la expresión decimal de un número racional podemos distinguir 
la parte entera, el anteperíodo y el período. 
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Recíprocamente, todo número cuya expresión decimal sea de esta forma es 
un número racional. Veámoslo con un ejemplo, r = 37, 195 513. Vamos a 
encontrar una fracción igual a r. El método es general. Multiplicamos por un 
1 seguido de tantos ceros como cifras hay en el período más el anteperíodo: 

(100.000)r = 3.719.513,513 . 

Le restamos r multiplicado por un 1 seguido de tantos ceros como cifras hay en 
el anteperíodo: 

(l.OOO.OOO)r - (l.OOO)r = 3.719.513 + 0, 513 -3.719 - 0, 5?3= 3.715.794. 
Por consiguiente 

_ 3.715.794 
999.000 ' 

■ 

Un problema que surge a menudo es el de determinar si una serie dada an es 
o no convergente. Lo más elemental que puede decirse al respecto es que para 
que una serie converja su término general ha de tender a 0. En efecto: 

oo 

Teorema 1.87 Sea {a n }^ =a una sucesión en K. Si la serie Yl a n es conver- 
gente, entonces líma„ = 0. 

n 

k 

Demostración: Sea Sk = a «- Q ue ^ a ser i e converja a un número 

n=0 

L significa por definición que existe límSfc = L. En tal caso también existe 

fe 

límS^-i = L, pues es el límite de una subsucesión, y entonces 

fe 

límafc = lím(Sk — Sk-i) = L — L = 0. 
fe fe 



Así, si no sumamos cada vez cantidades más pequeñas la serie no puede 
converger. El recíproco es tentador, pero falso. Basta considerar la serie deter- 
minada por la más sencilla de las sucesiones que tienden a 0: 

oo 

Ejemplo La serie Y \ es divergente. 

71=1 

En efecto, observemos que 
Si - 1, 

s 2 = i + 

o 1 1 o 2 , 1 1 

= ^+3 + 4 >^+ 4 = 1 + 2 + 2 ' 

1 1 1 1 o 4 , 1 1 1 

58 = ^ + 5 + 6 + 7 + 8 > ^ + 8 >1+ 2 + 2 + 2- 
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En general 5 2 " > 1 + f , y esta sucesión tiende a +oo, luego las sumas 
parciales no están acotadas y la serie diverge. ■ 

Se conocen muchos criterios para determinar el carácter convergente o di- 
vergente de una serie. Por ejemplo, el siguiente es aplicable a series de términos 
positivos. 

Teorema 1.88 (Criterio de D'Alembert) Sea {a„}^L 0 una sucesión de nú- 
meros reales positivos tal que exista lím a " +1 = L € R. Entonces: 

n an 

a) Si L < 1 la serie {a n }^L 0 es convergente. 

b) Si L > 1 la serie {a-n} n < Lo es divergente. 

DEMOSTRACIÓN: a) Sea e > 0 tal que L + e < 1. Entonces ]-oo, L + e[ es un 
entorno de L, y por definición de límite existe un natural n 0 tal que si n > n 0 
entonces < L + e o, lo que es lo mismo, a n+ \ < a n (L + e). Así pues, 

a„ 0+ i < a no (L + e), 

a n „+2 < a na+ i(L + e) <a na (L + e) 2 , 

an 0 +3 < a na+2 (L + e) <a na (L + e) 3 ,... 
En general, si n > no, se cumple que 

a n < a no (L + e)"""° = (¿ ""° )rao (¿ + c)". 
De aquí que si k > n 0 , 

fc fe fe oo 

n— 0 n— 0 n— no + 1 n— no + 1 

donde la última serie converge porque es geométrica de razón L + e < 1 . La 

oo 

serie a n es de términos positivos y sus sumas parciales están acotadas, luego 
converge. 

b) Sea ahora e > 0 tal que 1 < L — e. Igual que en el apartado anterior existe 
un natural no tal que si n > n 0 entonces a n+ i > a n (L — e), de donde se deduce 
igualmente que si n > n 0 entonces 



y por consiguiente, para k > n 0 , 

fe rio fe 

E^E««+7^w E (L-er, 

n—Q n—0 ^ 1 n— no + 1 

pero ahora la última serie diverge, pues es geométrica de razón mayor que 1, 
luego sus sumas parciales no están acotadas, y las de la primera serie tampoco. 
Así pues, ésta es divergente. ■ 

En el caso de que el límite L exista y valga 1 no es posible asegurar nada, 
hay casos en los que esto ocurre y la serie converge y casos en los que diverge. 
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oo 

M 



Ejemplo Si M > 0, la serie es convergente, pues por el criterio de 
D'Alembert, 

„ M n+1 M n „ M 

L = Km t — : — - = Km = 0 < 1. 

n (n + lj! n! « n + 1 

Incidentalmente, esto prueba también que Km = 0. 

Notar que Kemos determinado el carácter de la serie, pero no Kemos dicKo 
nada sobre el cálculo efectivo de su límite. La razón es que no Kay nada que 
decir. Por ejemplo, en el caso más simple, M = 1, el número 

oo ^ 

es un número "nuevo" , en el sentido de que no es racional, ni la raíz cuadrada 
de un número racional, ni en general expresable en términos de otros números 
ya conocidos. Más adelante demostraremos que de KecKo se trata de un número 
trascendente sobre Q. El único sentido en que podemos "calcularlo" es en el de 
obtener aproximaciones racionales sumando términos de la serie. El resultado 
es 

e = 2, 7182818284590452353602874. . . 



Para acabar demostraremos un criterio válido para las llamadas series alter- 
nadas, es decir, para series de números reales en las que los términos sucesivos 
tienen signos opuestos: 

Teorema 1.89 (Criterio de Leibniz) Sea {a„}^° =0 una sucesión de números 

oo 

reales positivos decreciente y convergente a 0. Entonces la serie (~ l)" fl n es 
convergente. 

DEMOSTRACIÓN: Consideremos primero las sumas parciales pares. Por 
ejemplo: 

Se = («o - + (02 - «3) + («4 - a 5 ) + a e . 

Teniendo en cuenta que la sucesión es decreciente, los sumandos así agrupa- 
dos son todos mayores o iguales que 0, luego en general S2n > 0. 

Por otra parte, Sg = Sq + (—ai + a8) < S$, luego la sucesión {S2 n }%Lo es 
monótona decreciente y acotada inferiormente por 0. Por lo tanto converge a 
un número L. 

Abora, S 2n +i = S 2n + «271+1, luego existe Km5 2 „+i = L + 0. 

n 

Es fácil comprobar que si las dos subsucesiones {S 2n }^Lo y {^2n+i}^Lo 
convergen a un mismo número L, entonces toda la sucesión {S n }^ =0 converge 
ai, es decir, la serie converge. ■ 

00 

Por ejemplo, la serie es convergente. De nuevo no tenemos 

más medio para calcular su límite que aproximarlo por una suma parcial. En 
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realidad, cuando hacemos esto necesitamos saber cuál es el error cometido, para 
determinar el número de cifras decimales correctas. Por ejemplo, las primeras 
sumas parciales de esta serie son: 



1 


1 


11 


0,73654 


21 


0,71639 


31 


0,70901 


2 


0, 50000 


12 


0,65321 


22 


0, 67093 


32 


0,67776 


3 


0, 83333 


13 


0,73013 


23 


0,71441 


33 


0,70806 


4 


0, 58333 


14 


0,65870 


24 


0, 67274 


34 


0,67865 


5 


0, 78333 


15 


0,72537 


25 


0,71274 


35 


0,70722 


6 


0,61666 


16 


0,66287 


26 


0, 67428 


36 


0,67945 


7 


0, 75952 


17 


0,72169 


27 


0,71132 


37 


0,70647 


8 


0, 63452 


18 


0,66613 


28 


0, 67560 


38 


0,68016 


9 


0, 74563 


19 


0,71877 


29 


0, 71009 


39 


0,70580 


10 


0, 64563 


20 


0,66877 


30 


0, 67675 


40 


0,68080 



El límite vale 0, 6931471805599453094172321. . . Por lo tanto, si al calcular 
la décima suma afirmáramos que el límite vale 0, 6456. . . estaríamos cometiendo 
un grave error. En realidad sólo la primera cifra decimal es exacta (se dice que 
un número decimal finito aproxima a otro con n cifras exactas si las n primeras 
cifras de ambos números coinciden). En general, al aproximar una serie por 
una suma parcial, o al aproximar cualquier límite de una sucesión por uno de 
sus términos, no sabemos cuál es el error cometido, ni en particular cuántas 
de las cifras de la aproximación son exactas. Sin embargo, en el caso de las 
series alternadas es fácil saberlo pues, según hemos visto, las sumas pares son 
decrecientes (siempre están sobre el límite) y las impares son crecientes (siempre 
están bajo el límite), luego las últimas sumas de la tabla nos dicen que el límite 
se encuentra entre 0,68 y 0,71 y por lo tanto no sabemos ninguna de sus cifras 
con exactitud (salvo el 0). Yendo más lejos tenemos: 

Siooo = 0, 69264 y S 1001 = 0, 69364, 

lo que nos permite afirmar que el límite está entre 0, 692 y 0, 694, es decir, es de 
la forma 0, 69. . . y ya tenemos dos cifras exactas. 

En la práctica ignoraremos el problema técnico de determinar las cifras 
exactas que nos proporciona una aproximación dada, y consideraremos que un 
número es "conocido" si tenemos una sucesión que converge a él. Todas las 
aproximaciones que daremos (calculadas con ordenador con técnicas de análisis 
numérico) tendrán todas sus cifras exactas. 



Capítulo II 

Compacidad, conexión y 
completitud 

Finalmente tenemos los suficientes elementos de topología como para que 
ésta se convierta en una herramienta eficaz. En los temas anteriores apenas he- 
mos extraído las consecuencias más elementales de las definiciones de topología, 
continuidad, etc. Los resultados que veremos ahora van mucho más lejos y dan 
una primera muestra de las posibilidades de las técnicas topológicas. 

2.1 Espacios compactos 

La compacidad es en topología una propiedad similar a la "dimensión finita" 
en álgebra lineal. Los espacios compactos no son necesariamente finitos, pero se 
comportan en muchos aspectos como si lo fueran. Por ejemplo, es obvio que en 
un espacio finito toda sucesión ha de tomar infinitas veces un mismo valor, luego 
toda sucesión contiene una subsucesión constante, en particular convergente. Lo 
mismo ocurre en IR, como se desprende del teorema siguiente. 

Teorema 2.1 Toda sucesión en un conjunto totalmente ordenado contiene una 
subsucesión monótona. 

DEMOSTRACIÓN: Sea {a n }^ 0 una sucesión en un conjunto totalmente or- 
denado. Sea A el conjunto de las imágenes de la sucesión. Si A es finito es obvio 
que A tiene una subsucesión constante, luego monótona. Supongamos que A es 
infinito. 

Si todo subconjunto no vacío de A tiene mínimo podemos tomar Xq igual al 
mínimo de A, luego X\ igual al mínimo de A \ {xo}, luego Xi igual al mínimo 
de A \ {x 0} Xi}, y así obtenemos puntos x 0 < x\ < x 2 <■ ■ ., es decir, obtenemos 
un subconjunto de A sin máximo. 

Así pues, o bien existe un subconjunto de A sin mínimo o bien existe un 
subconjunto de A sin máximo. Los dos casos se tratan igual. Supongamos que 
hay un subconjunto de A sin mínimo. Llamémoslo B. 
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Sea a„ 0 un elemento cualquiera de B. Como B no tiene mínimo contiene 
infinitos términos de la sucesión bajo a„ 0 , pero sólo un número finito de ellos 
tienen índice anterior a n 0 , luego existe un a ni en B tal que a ni < a no y n 0 < n\. 
Podemos repetir indefinidamente este proceso y obtener una subsucesión 

monótona decreciente. ■ 

Como en R toda sucesión monótona converge a su supremo o a su ínfimo, 
esto prueba que en este espacio toda sucesión contiene una subsucesión conver- 
gente, al igual que ocurre en los espacios finitos. Cualquier intervalo [a, 6] es 
homeomorfo a R, luego también cumple esto mismo. 

Por otro lado esto es falso en R. La sucesión de los números naturales no con- 
tiene ninguna subsucesión convergente (ya que cualquier subsucesión converge 
a +00 en R, luego no converge en R). 

El espacio R y los intervalos [a, b] son ejemplos de espacios compactos. La 
propiedad de las subsucesiones convergentes caracteriza la compacidad en espa- 
cios métricos, pero para el caso general necesitamos otra definición más elabo- 
rada. 

Definición 2.2 Sea X un espacio topológico. Un cubrimiento abierto de X es 

una familia {Ai} ieI de abiertos de X tal que X = [j A¡. 

iei 

Un subcubrimiento del cubrimiento dado es un cubrimiento formado por 
parte de los abiertos del primero. 

Un espacio de Hausdorff K es compacto si de todo cubrimiento abierto de 
K se puede extraer un subcubrimiento finito. 

Es obvio que si X es un espacio finito, de todo cubrimiento abierto se puede 
extraer un subcubrimiento finito. Basta tomar un abierto que contenga a cada 
uno de los puntos del espacio. Así pues, todo espacio de Hausdorff finito es 
compacto. 

Observar que si 23 es una base de un espacio de Hausdorff K, se cumple que 
K es compacto si y sólo si todo cubrimiento de K por abiertos básicos admite 
un subcubrimiento finito. En efecto, si {Ai} ie i es un cubrimiento arbitrario, 
para cada punto x € K existe un i x (E I tal que x G Ai x y existe un B x £ "B 
tal que x G B x C A ix . Entonces {B x } x£ k es un cubrimiento de K formado por 
abiertos básicos y tiene un subcubrimiento finito 

K = B X1 U • • • U B Xn C A lxi U • • • U A lxn C K. 

Una familia de abiertos forma un cubrimiento si y sólo si la familia de sus 
complementarios es una familia de cerrados con intersección vacía. Por ello la 
compacidad puede caracterizarse así en términos de familias de cerrados: 

Un espacio de Hausdorff K es compacto si y sólo si toda familia de cerrados 
{C¿}i 6 / con la propiedad de que cualquier intersección finita de ellos no es vacía, 
tiene intersección total no vacía. 
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La propiedad de que las intersecciones finitas sean no vacías se llama pro- 
piedad de la intersección finita. Por lo tanto: 

Teorema 2.3 Un espacio de Hausdorff K es compacto si y sólo si toda familia 
de cerrados de K con la propiedad de la intersección finita tiene intersección no 
vacía. 

A menudo nos encontraremos con espacios que no son compactos pero tienen 
subespacios compactos. Por ello resulta útil caracterizar la compacidad de un 
subespacio en términos de la topología de todo el espacio y no de la topología 
relativa. Concretamente: 

Teorema 2.4 Sea X un espacio de Hausdorff y K un subespacio de X. Enton- 
ces K es compacto si y sólo si para toda familia {Ai} ieI de abiertos (básicos) 
de X tal que K C 1J Ai se puede extraer una subfamilia finita que cumpla lo 
mismo. ieI 

DEMOSTRACIÓN: Supongamos que K es compacto. Entonces {Ai n K} iG j 
es claramente un cubrimiento abierto de K, del que podemos extraer un subcu- 
brimiento finito de modo que 

K = (A n n K) u ■ ■ ■ u (A tn n K), 

luego K C A ix U • • • U A in . 

Recíprocamente, si K cumple esta propiedad y {Ai} ie j es un cubrimiento 

abierto de K, entonces para cada i existe un abierto i?¿ de X tal que Ai = 

Bi n K. Consecuentemente K — (J Ai C (J -B¿, luego por hipótesis podemos 

iei iei 

tomar un número finito de conjuntos de modo que K C B il U • • • U B in , luego 
K = (B, h (~l K) U • • • U {B ln D K) = A i± U ■ ■ ■ U A in . Así pues, K es compacto. 

■ 

Si la unión de una familia de abiertos de un espacio X contiene a un subes- 
pacio K, diremos que forma un cubrimiento abierto de K en X. Así pues, un 
subespacio K de X es compacto si y sólo si de todo cubrimiento abierto de K 
en X puede extraerse un subcubrimiento finito (en X también). 

Aquí estamos considerando la topología de X, pero deberemos tener siempre 
presente que la compacidad es una propiedad absoluta, y depende exclusiva- 
mente de la topología del propio espacio K. 

Los teoremas siguientes muestran la anunciada similitud entre los espacios 
compactos y los espacios finitos. Por lo pronto, todo espacio finito es cerrado. 
El análogo con compactos es el siguiente: 

Teorema 2.5 Se cumplen las propiedades siguientes: 

a) Si X es un espacio de Hausdorff y K C X es compacto, entonces K es 
cerrado en X. 

b) Si K es un compacto y C C K es un cerrado, entonces C es compacto. 
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c) Si M es un espacio métrico y K C M es compacto, entonces K está 
acotado. 

DEMOSTRACIÓN: a) El argumento es el mismo que emplearíamos si K fuera 
finito. Veamos que X \ K es abierto. Sea x £ X \ K. Para cada punto u € K 
existen abiertos disjuntos A u y B u tales que u € A u y x € B u . Si K fuera 
finito bastaría tomar ahora la intersección de los B u y tendríamos un entorno 
de x contenido en X \ K. Ahora aplicamos la compacidad de K. Los conjuntos 
A u forman un cubrimiento abierto de K, luego existe un subcubrimiento finito: 

n 

K C A Ul U • • • U A Un . Ahora, f"| B u . es un entorno de x que no corta a K, luego 
X \ K es un entorno de x. 

b) Si {Ai} ie i es un cubrimiento abierto de C, entonces {Ai} ie i U {K \ C}es 
un cubrimiento abierto de K, luego existe un subcubrimiento finito 

K = A il U---UA in U(K\C). 

Claramente entonces C C A i± U • • • U A in , luego C es compacto. 

c) Sea x € M un punto cualquiera. Para cada u € K, sea r u = d(x, u) + 1. 
Obviamente íf C |J B ru (x). Por compacidad podemos extraer un subcubri- 

miento finito de modo que K C B rui (x) U • • • U B run (x) . Las bolas son conjuntos 
acotados, una unión finita de acotados es acotada y todo subconjunto de un aco- 
tado está acotado. Por tanto K está acotado. ■ 

Teorema 2.6 Si K es un espacio compacto, toda sucesión en K posee un punto 
adherente. Por tanto si además K cumple 1AN, toda sucesión en K tiene una 
subsucesión convergente. 

DEMOSTRACIÓN: Sea {a n }^ =0 una sucesión en K. Sea A n = {a m \ m > n}. 
Obviamente 

A 0 D A 1 D A 2 D A 3 D A A D. . . , 

luego también 

A 0 D Ai D A~ 2 3 A 3 D A 4 D. . . , 
y así tenemos una familia de cerrados con la propiedad de la intersección finita. 

oo _ 

Por compacidad existe un punto x € f] Ai. Obviamente x es un punto adhe- 

¿=o 

rente de la sucesión, pues si n es un natural y U es un entorno de x, entonces 
x e A n , luego U n A n ^ 0, es decir, existe un m > n tal que a m € U. ■ 

Como habíamos anunciado, esta propiedad caracteriza a los espacios métri- 
cos compactos. 

Teorema 2.7 Un espacio métrico M es compacto si y sólo si toda sucesión en 
M tiene una subsucesión convergente. 
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DEMOSTRACIÓN: Supongamos que M no fuera compacto. Entonces existiría 
un cubrimiento abierto M = (J Ai que no admite subcubrimientos finitos. 

iei 

Sea e > 0 y x 0 € M. Si B e (x) ^ M, existe un punto x\ G M tal que 
d(xi,Xo) > e. Si B € (x 0 ) U B e (xi) 7^ M, existe un punto .x 2 € M tal que 
d(x 2 ,x 0 ) > e, d(a; 2 ,:ri) > e. 

Si M no pudiera cubrirse por un número finito de bolas de radio e, podríamos 
construir una sucesión {x n }^ =0 con la propiedad de que d{x il Xj) > e para 
todos los naturales i, j. Es claro que tal sucesión no puede tener subsucesiones 
convergentes, pues una bola de centro el límite y radio e/2 debería contener 
infinitos términos de la sucesión, que distarían entre sí menos de e. 

Concluimos que para todo e > 0 existen puntos xo,...,x n G M de modo 
que M = B e (x 0 ) U • • • U B € (x n ). 

Lo aplicamos a e = 1 y obtenemos tales bolas. Si todas ellas pudieran 
cubrirse con un número finito de abiertos Ai también M podría, luego al menos 
una de ellas, digamos B\(xq) no es cubrible por un número finito de abiertos 
del cubrimiento. 

Igualmente, con e — 1/2 obtenemos una bola B 1 / 2 {xi) no cubrible por un 
número finito de abiertos del cubrimiento. En general obtenemos una sucesión 
de bolas 5i/( n +i)(2?n) con esta propiedad. 

Sea x un punto adherente de la sucesión {a; n }ÍÍLo- ^ ea * € / tal que x € A¿. 
Como Ai es un abierto existe un número natural k tal que B 2 /(k+i){ x ) C A¿. Sea 
n > k tal que d(x n ,x) < l/(fe + l). Entonces -Bi/( n +i)(a;„) C B 2 /(fe+i)(^) C A ¿ , 
en contradicción con que -Bi/( ra +i)(^n) no era cubrible con un número finito de 
abiertos del cubrimiento. ■ 

Según lo visto al comienzo de la sección, K es compacto. Además: 

Teorema 2.8 Un subconjunto de R es compacto si y sólo si es cerrado y aco- 
tado. 

Demostración: Por el teorema 2.5, todo compacto en IR ha de ser cerrado 
y acotado. Si C es un conjunto cerrado y acotado, toda sucesión en C tiene 
una subsucesión convergente en K. Como C es acotado su límite estará en R y 
como C es cerrado, su límite estará en C, luego toda sucesión en C tiene una 
subsucesión convergente en C . Por el teorema anterior C es compacto. ■ 

También se puede probar el teorema anterior viendo que los cerrados y aco- 
tados de R son precisamente los subconjuntos cerrados de R (o, si se prefiere, 
esto es consecuencia inmediata del teorema anterior) . 



Ejemplo Vamos a usar la compacidad de [0, 1] para calcular el cardinal de ' 
Si I = [a, b] es un intervalo cerrado, llamaremos 



Jn = 



a, a + 



h = 



que son dos intervalos cerrados disjuntos contenidos en /. 
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De este modo, partiendo de 7 = [0, 1] podemos formar los intervalos 7 0 , I\, 
loo, loi, ho, hi, etc. Más exactamente, para cada aplicación s : N — > {0, 1} 
y cada n € N, si llamamos s\ n — so ■ ■ ■ s„_i, tenemos definidos los intervalos 
I s \ (entendiendo que 7 s i 0 = 7), y es claro que forman una sucesión decreciente, 
es decir, si m < n entonces 7 s | n C I s \ m - P° r 1° tanto, {I s \ n }^ =0 es una familia 
de cerrados en 7 con la propiedad de la intersección finita. Por compacidad 

oo 

tenemos que I„ = f] I s \ n ^ 0. Más aún, es claro que la longitud (el diámetro) 

de I s \ n es 1/3™, y como I s C I s i , necesariamente el diámetro de I s ha de ser 
menor o igual que 1/3™ para todo n, es decir, ha de ser 0. Esto implica que I s 
contiene un único punto. Digamos I s = {x s }. 

También es claro que si s ^ t entonces x s ^ x t . En efecto, si n es el primer 
natural tal que s|„+i ^ t n+í , entonces I s \ — I t \ y los intervalos I s \ , 7¿i 
son subconjuntos disjuntos. Como contienen a x s y x t respectivamente, éstos 
han de ser puntos distintos. 

Esto prueba que |7| > |2 N | = 2 N °. Por otra parte, |R| < 2 H ° , pues si a 
cada r 6 1 le asignamos el conjunto de los números racionales menores que r 
obtenemos una aplicación inyectiva de R en las partes de Q. Por consiguiente 
tenemos que |7| = |R| = 2 N °. ■ 

Teorema 2.9 (Teorema de Tychonoff) El producto de espacios compactos 
es compacto. 

DEMOSTRACIÓN: Sea K = Y\Ki un producto de espacios compactos. To- 

iei 

memos una familia 53 de cerrados en K con la propiedad de la intersección finita. 
Hemos de probar que su intersección es no vacía. El conjunto de todas las fami- 
lias de subconjuntos no vacíos de K (no necesariamente cerrados) que contienen 
a 23 y tienen la propiedad de la intersección finita, parcialmente ordenado por 
la inclusión, satisface las hipótesis del lema de Zorn, lo que nos permite tomar 
una familia maximal IX. Entonces f] U C f] B, luego basta probar que la 
primera intersección es no vacía. UeU Be:B 

En primer lugar observamos que si un conjunto A C K corta a todos los 
elementos de U entonces está en IX, pues en caso contrario IX U {^4} contradiría 
la maximalidad de IX. 

Sea pi : K — > 7Í¿ la proyección en el factor i-ésimo. Es fácil ver que la 
familia {p¿[i7] | U € IX} tiene la propiedad de la intersección finita luego, por la 
compacidad de 7Í¿, existe un punto Xi £ 7Q tal que x¿ G Pi[U] para todo U € IX. 

Estos puntos determinan un punto x € K. Basta probar que x £ f] U. 

ueu 

Fijemos un entorno básico de x, de la forma A = C\ p ¿ _1 [G¿], donde F C 7 

i£F 

es finito y G¿ es abierto en 7Í¿. Para cada U € IX tenemos que Xi G Pi[¿7], 
luego Gi n Pi[U] ^ 0, luego p~ 1 [G¿] n U ^ 0. Como esto es cierto para todo 
U € IX, según hemos observado antes podemos concluir que p~ 1 [G i ] € IX, para 
todo i € F. Como IX tiene la propiedad de la intersección finita, A € IX. De 
aquí se sigue que A corta a todo U £ IX y, como A es un entorno básico de x, 
esto implica que x € U para todo U £ tí. ■ 
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Ahora podemos probar: 

Teorema 2.10 Un subconjunto de K n , es compacto si y sólo si es cerrado y 
acotado. 

Demostración: La acotación depende en principio de la distancia que 
consideremos. Hemos de entender que se trata de la inducida por cualquiera de 
las tres normas definidas en el capítulo I. Por el teorema 1.5, todas tienen los 
mismos acotados. Trabajaremos concretamente con 



Como C" es homeomorfo a IR 2 " (con los mismos conjuntos acotados), basta 
probar el teorema para IR™. Ya hemos visto que un compacto ha de ser cerrado 
y acotado. Supongamos que K es un subconjunto de IR™ cerrado y acotado. 
Esto significa que existe un M > 0 tal que para todo punto x <G C se cumple 
\\x\\ < M, lo que significa que si x G C, cada Xi € [—M,M] o, de otro modo, 
que C C [— M, M] n . 

Pero por el teorema anterior [— M, M] n es compacto y C es cerrado en él, 
luego C también es compacto. ■ 

Los espacios que nos van a interesar son fundamentalmente los subconjuntos 
de IR™. Vemos, pues, que la compacidad es muy sencilla de reconocer. En 
particular las bolas cerradas y las esferas son compactos. El espacio C°° es 
homeomorfo a una esfera, luego es compacto. Lo mismo ocurre con IR°°, que es 
homeomorfo a una circunferencia. 

Una de las propiedades mas importantes de la compacidad es que se conserva 
por aplicaciones continuas (compárese con el hecho de que la imagen (continua) 
de un conjunto finito es finita). 

Teorema 2.11 La imagen de un espacio compacto por una aplicación continua 
es de nuevo un espacio compacto (supuesto que sea un espacio de Hausdorff). 

DEMOSTRACIÓN: Sea / : K — > X continua y suprayectiva. Supongamos 
que K es compacto y que X es un espacio de Hausdorff. Si {A¿}¿ 6 / es un 
cubrimiento abierto de X, entonces {/"H^M}^/ es un cubrimiento abierto 
de K, luego admite un subcubrimiento finito K = U • • • U /"^AjJ. 

Entonces X = A tl U • • • U A in . ■ 

Este hecho tiene muchas consecuencias. 

Teorema 2.12 Si f : K — > X es biyectiva y continua, K es compacto y X es 
un espacio de Hausdorff, entonces f es un homeomorfismo. 

DEMOSTRACIÓN: Basta probar que la inversa en continua, o sea, que trans- 
forma cerrados de K en cerrados de X, o equivalentemente, que si C es cerrado 
en K, entonces f[C] es cerrado en X, pero es que C es compacto, luego f[C] 
también lo es, luego es cerrado. ■ 
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Ejemplo Una circunferencia es homeomorfa a un cuadrado. 

En efecto, si C es un cuadrado de centro (0,0) en IR 2 , es claro que la apli- 
cación de C en la circunferencia unidad dada por x ^ x/\\x\\ es biyectiva y 
continua y, como C es compacto, es un homeomorfismo. ■ 

*Ejemplo Los espacios proyectivos son compactos. 

En efecto, basta probar que P"(K) es compacto, pero la restricción de la 
proyección a la esfera unidad de K™ +1 es continua y suprayectiva y la esfera es 
compacta. ■ 

Otro hecho obvio es que toda aplicación continua de un compacto a un 
espacio métrico está acotada. Para las funciones reales podemos decir más: 

Teorema 2.13 Si f : K — > IR es continua y K es un compacto no vacío, 
existen u, v € K tales que para todo x € K, se cumple f(u) < f(x) < f(v). Es 
decir, que f alcanza un valor mínimo y un valor máximo. 

DEMOSTRACIÓN: Sea C = f[K\. Entonces C es cerrado y acotado. Sean m 
y M su ínfimo y su supremo, respectivamente. Así para todo x G K se cumple 
que m < f(x) < M. Sólo falta probar que m y M son imágenes de puntos de 
K, o sea, que m, M € C. Veámoslo para M. 

Si e > 0, entonces M — e no es una cota superior de C, luego existe un punto 
y e C de modo que M - e < y, es decir, que ]M — e, M + e[ H C 0. Esto 
significa que todo entorno (básico) de M corta a C, o sea, M £ C = C. m 

Observar que este resultado es falso sin compacidad. Por ejemplo la función 
/ : ]0, 1[ — > IR dada por f(x) = x no tiene máximo ni mínimo. Veamos una 
aplicación del teorema anterior: 

Teorema 2.14 Todas las normas en K™ inducen la misma topología. Además 
los subconjuntos acotados son los mismos para todas ellas. 

Demostración: Sea || || : K™ — > [0, +oo[ una norma cualquiera. Vamos 

n 

a ver que induce la misma topología que la dada por ||x||i = Yl \ x i\ Y Q ue l° s 

»=i 

acotados son los mismos para ambas. Esto probará el teorema. 

Sea {ei, . . . , e„} la base canónica de K n . Si x G K™ se puede expresar como 

n 

x = xíCí, luego 

i=l 

NI < ¿ W IN| < ¿INIi NI = Nli¿INI = ^Nli- 

i— 1 i—1 i—1 

Por lo tanto, si x, y <E K", se cumple | ||x|| — ||y|| | < \\x — y\\ < K\\x — y\\i, 
o sea que la aplicación || || tiene la propiedad de Lipschitz, luego es continua 
respecto a la topología inducida por || \\i. 

Sea S = {x G K™ | ||a;||i = 1}. Se trata de una esfera, luego de un conjunto 
compacto para lo topología usual de K n . Por lo tanto la aplicación || || alcanza 
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su máximo y su mínimo en S y así, como no se anula, existen 0 < m < M en IR 
tales que para todo x G S se tiene m < \\x\\ < M. 

Si x € K n \ {0}, entonces a;/||x||i € S 1 , luego m < ||x/||x||i|| < M, es decir, 

ro||s||i < <M\\x\\ u 

o también, 

Wl<^NI, 11*11 < M\\x\\!. 

Como 0 cumple esto trivialmente, en realidad vale para todo x € K n . De 
aquí se sigue que toda bola de centro x con respecto a una norma contiene 
a otra respecto a la otra norma, luego los acotados son los mismos. Además 
todo entorno de un punto para una norma lo es para la otra norma, luego las 
topologías inducidas son las mismas. ■ 

Así pues, podemos hablar de acotados en K n sin precisar la norma a la que 
nos referimos. Sin embargo no hay que olvidar que los acotados pueden variar 
si consideramos métricas que no provengan de normas. Por ejemplo la distancia 

d(x,y) = mín{||x - y\\, 1}. 

También es claro que el teorema anterior es válido de hecho para cualquier 
K-espacio vectorial de dimensión finita. 

2.2 Espacios conexos 

Pensemos en los espacios siguientes: [0, 1] y [0, 1] U [2, 3]. Hay una diferencia 
esencial entre ellos, y es que el primero está formado por "una sola pieza" 
mientras que el segundo consta de "dos piezas" . La diferencia no es conjuntista, 
pues también podemos dividir [0,1] = [0,1/2] U]l/2,1], pero esto no son dos 
piezas en el mismo sentido que en el caso de [0, 1] U [2, 3]. La diferencia es que 
los intervalos [0, 1/2] y ]l/2, 1] están "pegados" mientras que los intervalos [0, 1] 
y [2,3] están "separados". Con más precisión, el punto 1/2 está sólo en uno de 
los intervalos, el [0, 1/2], pero aunque no está en el otro, está pegado a él, en el 
sentido de que está en su clausura. 

En general, si un espacio X se expresa como X = U U V, donde U y V 
son disjuntos y no vacíos, podemos decir que U y V son dos "piezas" en el 
sentido que estamos considerando si U no contiene puntos de la clausura de V 
y viceversa. Ahora bien, cualquier punto de V que no estuviera en V debería 
estar en U, luego la condición equivale a que V = V y U = U, o sea, a que 
U y V sean cerrados. Por otra parte, dado que U y V son complementarios, 
es lo mismo decir que son cerrados o que son abiertos. Con ello llegamos a la 
definición de conexión: 

Definición 2.15 Un espacio topológico X es disconexo si existen subconjuntos 
abiertos U y V en X tales queI = í/UV, U C\V = 0 y U ^ 0 ^ V. En caso 
contrario X es conexo. 
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Segiín hemos dicho, es indistinto exigir que U y V sean abiertos como que 
sean cerrados, pues de hecho si cumplen esto son a la vez abiertos y cerrados. 
Por lo tanto, un espacio X es conexo si y sólo si sus únicos subconjuntos que 
son a la vez abiertos y cerrados son X y 0. 

Es obvio que [0, 1] U [2, 3], o incluso [0, l/2[U]l/2, 1] son ejemplos de espacios 
disconexos. Notar que [0,l/2[ no es cerrado en R, pero sí lo es en el espacio 
[0, l/2[ U ]1/2,1] (su clausura en este espacio es la intersección con él de su 
clausura en R, que es [0, 1/2], o sea, es [0, l/2[). 

Es importante tener claro que los intervalos [0, l/2[ y ]l/2, 1] están separados 
pese a que sólo falta un punto entre ellos. La falta de ese punto es suficiente 
para que ambas partes no se puedan "comunicar", en el sentido de que, por 
ejemplo, ninguna sucesión contenida en una de las piezas puede converger a un 
punto de la otra. Esto es suficiente para que ambas partes sean independientes 
topológicamente. Así, la función / : [0, l/2[ U ]l/2, 1] — > R dada por 



es continua, mientras que sería imposible definir una función continua sobre 
[0, 1] que sólo tomara los valores 1 y 2. 

Si la desconexión de estos espacios es clara, no lo es tanto la conexión de 
espacios como [0, 1]. 

Ejercicio: Probar que el intervalo [0, 1] C Q es disconexo. 

Teorema 2.16 Un subconjunto de R es conexo si y sólo si es un intervalo. 

DEMOSTRACIÓN: Sea C un subespacio conexo de R. Sean a y b su ínfimo 
y su supremo, respectivamente. Vamos a probar que C es uno de los cuatro 
intervalos de extremos a y b. Para ello basta ver que si a < x < b entonces 
x € C. En caso contrario los conjuntos C H [— oo,x[ y Cíl ]x, +oo] son dos 
abiertos disjuntos no vacíos de C cuya unión es C. 

Tomemos ahora un intervalo / y veamos que es conexo. Supongamos que 
existen abiertos disjuntos no vacíos U y y en I de modo que I = U U V. 
Tomemos x € U e¡/eV. Podemos suponer que x < y. 

Como / es un intervalo, [x,y] C / y U' = U n [x, y], V = V n [x,y] son 
abiertos disjuntos no vacíos en [x, y] de modo que [x, y] = U' U V. 

Sea s el supremo de U'. Entonces s € U' H [x, y] = U' , luego en particular 
s < y. Claramente ]s, y] C V , luego s £ V f~l [x, y] = V , contradicción. ■ 

Una consecuencia de esto es que un intervalo [a, b[ no es homeomorfo a 
uno de tipo ]c,d[. En efecto, si eliminamos un punto de un intervalo ]c,d[ nos 
queda un espacio disconexo, mientras que en [a, b[ podemos eliminar el punto 
a y obtenemos un conexo. (Si fueran homeomorfos, el espacio que resultara de 
eliminar la imagen de a en ]c, d[ debería ser homeomorfo a \a, b[). 

Ejercicio: Probar que dos intervalos (acotados o no acotados) son homeomorfos si y 
sólo si son del mismo tipo: abierto ]a, b[, cerrado [a, b] o semiabierto [a,b[. 
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Los resultados siguientes permiten probar con facilidad la conexión de mu- 
chos espacios. El primero refleja el hecho de que las aplicaciones continuas 
pueden pegar pero nunca cortar. 

Teorema 2.17 Las imágenes continuas de los espacios conexos son conexas. 

Demostración: Si / : X — > Y es una aplicación continua y suprayectiva 
pero Y no es conexo, entonces X tampoco puede serlo, pues si A es una abierto 
cerrado no vacío en Y y distinto de Y, entonces Z" 1 ^] cumple lo mismo en X. 



Teorema 2.18 Sea {^4¿} í6 / una familia de subespacios conexos de un espacio 
X tal que f] Ai ^ 0 . Entonces (J Ai es conexo. 

iei iei 

DEMOSTRACIÓN: Supongamos que (J A,¿ = UUV, donde U y V son abiertos 

iei 

disjuntos. Entonces para un i cualquiera se tendrá que Ai = (U r\AA U (Vil Ai), 
pero U H Ai, Vfl A¡ son abiertos disjuntos en Ai, luego uno de ellos es vacío, y 
así Ai C U o bien A¿ C V. 

Pero si Ai C U, entonces U contiene a f] Ai, luego U corta a todos los A¿ 

i£l 

y por conexión los contiene a todos. Así (J Ai = U, y V = 0. Igualmente, si 

iei 

Ai C V se deduce que U es vacío. ■ 



Ejemplo Las circunferencias son conexas. 

Sea / : [—1, 1] — > {(x,y) £ R 2 \ x 2 + y 2 = 1, y > 0} la aplicación dada por 
/(a;)=(^v / r^). 

Claramente / es continua y suprayectiva, lo que prueba que la semicircun- 
ferencia es conexa. Igualmente se prueba que la semicircunferencia opuesta es 
conexa, y como ambas se cortan en los puntos (±1,0), su unión, es decir, la 
circunferencia, es conexa. ■ 



Teorema 2.19 Si A es un subespacio conexo de un espacio X, entonces A es 
conexo. 

Demostración: Supongamos que A = U U V, donde U y V son abiertos 
disjuntos en A. Entonces A = (U H A) U (V H A), y U n A, V H A son abiertos 
disjuntos en A. Por conexión uno es vacío, luego A C U o bien A C V. Digamos 
AcU cA. 

Pero Í7 es cerrado en A, luego A C U = U, es decir, {/ = iyl / =0. Esto 
prueba que A es conexo. ■ 

Hemos dicho que un espacio disconexo es un espacio formado por varias 
"piezas" ahora podemos dar una definición rigurosa de lo que entendemos por 
una "pieza". 
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Definición 2.20 Sea X un espacio topológico y x £ X. Llamaremos compo- 
nente conexa de x a la unión C(x) de todos los subconjuntos conexos de X que 
contienen a x. Por el teorema 2.18, C(x) es un conexo, el mayor subespacio 
conexo de X que contiene a x. 

Es obvio que si x, y € X, entonces C(x) y C(y) son iguales o disjuntas. En 
efecto, si tienen puntos en común, por el teorema 2.18 resulta que C(x) U C(y) 
es un conexo, luego C(x) U C(y) C C(x) y C(x) U C(y) C C(y), con lo que 
C(x)=C(x)uC(y)=C(y). 

En resumen, todo espacio X está dividido en componentes conexas disjuntas. 
Las componentes conexas son cerradas por el teorema 2.19. En efecto, C(x) es 
un conexo que contiene a x, luego C(x) C C(x). 

Sin embargo las componentes conexas no siempre son abiertas. Si un espacio 
tiene un número finito de componentes conexas, éstas serán abiertas y cerradas 
a la vez, evidentemente, pero si hay infinitas componentes ya no es necesario. 
Por ejemplo, ningún subconjunto de Q con más de un punto es conexo, porque 
no es un intervalo de IR, luego las componentes conexas de Q son los puntos, 
que no son abiertos. 

A la hora de probar que un espacio es conexo, resulta 
útil el concepto de arco. Un arco en un espacio X es una 
aplicación continua a : [0, 1] — > X. El espacio X es arco- 
conexo si para todo par de puntos x, y £ X existe un arco 
a : [0, 1] — > X tal que a(0) = x, a(l) = y. 

Como entonces x e y están en la imagen del arco a, que es un conexo, resulta 
que x e y están en la misma componente conexa de A", o sea, que X tiene una 
única componente conexa: Los espacios arco-conexos son conexos. El recíproco 
no es cierto, pero no vamos a dar un ejemplo. 

Dados dos puntos x, y £ M. n , el segmento que los une está formado por 
los puntos de la forma y + X(x — y), con A £ [0, 1]. Esto se puede definir en 
cualquier K-espacio vectorial. Si V es un espacio vectorial topológico y x, y £ V, 
entonces la aplicación a : [0, 1] — > V dada por a(X) = Xx + (1 — X)y es un arco 
(el segmento) que une x con y. 

Un subconjunto A de un K-espacio vectorial V es convexo si para todos los 
puntos x, y £ A y todo A £ [0, 1] se cumple Xx + (1 — X)y £ A, es decir, si 
cuando A contiene a dos puntos, también contiene al segmento que los une. 

Uniendo todo esto, resulta que en un espacio vectorial topológico, todo con- 
vexo es arco-conexo, luego conexo. En particular todo espacio vectorial to- 
pológico es conexo. En particular K™ es conexo. 

Ejercicio: Probar que toda esfera de centro O en R™ es imagen continua de R n \ {0}. 
Probar que R' 1 \ {0} es conexo y deducir de aquí la conexión de la esfera. 

Ejercicio: Probar que R 2 no es homeomorfo a R. 

Los conjuntos convexos tienen una propiedad que en general no cumplen los 
conexos, y es que, claramente, la intersección de convexos es convexa. 
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Ejemplo Las bolas en los espacios normados son convexas. 

En efecto, si x, y € B € (z), entonces ||a; — z\\ < e, \\y — z\\ < e, luego para 
todo A € [0,1] se cumple 

\\Xx + (1 - X)y - z\\ = \\Xx + (1 - X)y - Xz + (1 - A)z|| 

< \\X(x-z)\\ + \\(l-X)(y-z)\\ = X\\x-z\\ + (l-l)\\y-z\\ < Ae+ (1 - A)e = e. 
Por lo tanto Xx + (1 - A)y G B e (z). 

(Cambiando las desigualdades estrictas por desigualdades no estrictas se 
prueba que las bolas cerradas son convexas.) ■ 

Por esto se dice que los espacios normados son localmente convexos. En 
general, un espacio vectorial topológico es localmente convexo si tiene una base 
formada por conjuntos convexos. Igualmente un espacio topológico es localmente 
conexo o localmente arco-conexo si tiene una base formada por abiertos cone- 
xos o arco-conexos, respectivamente. Así, los espacios localmente convexos son 
localmente arco-conexos y los espacios localmente arco-conexos son localmente 
conexos. 

Un hecho importante es que si A es un abierto en un espacio localmente 
conexo X, entonces las componentes conexas de A son abiertas y cerradas. En 
efecto, si C es una componente conexa de A y x € C, entonces existe un abierto 
(básico) U de X tal que U es conexo y x € U C A. Como C es la componente 
conexa de x, ha de ser U C C, luego C es un entorno de x, o sea, C es entorno 
de todos sus puntos, luego es un abierto. 

Ejercicio: Probar que todo abierto no vacío en K es la unión disjunta de una cantidad 
numerable de intervalos abiertos. 

Veamos algunos hechos adicionales sobre arcos. Sean a y b dos arcos en un 
espacio X de modo que a(l) = 6(0). 

Entonces la aplicación bi : [1, 2] — > X dada por b\(t) = b(t — 1) es continua 
y cumple que 6i(l) = 6(0), 6^2) = 6(1) (se trata de la composición con 6 del 
homeomorfismo i : [1,2] — > [0, 1] dado por i(t) = t — 1). 




Ahora, la unión c = aU6i : [0, 2] — > X, esto es, la aplicación que restringida 
a [0, 1] es a y restringida a [1, 2] es 6i, es continua (porque restringida a los dos 
cerrados [0, 1] y [1, 2] lo es, y su imagen es la unión de las imágenes de a y 6. 

Finalmente, llamamos a U 6 : [0, 1] — > A a la función (a U b)(t) = c(2£), 
es decir, la composición de c con el homeomorfismo j : [0,1] — > [0, 2] definido 
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mediante j(t) = 2t. Claramente a U b es un arco cuya imagen es la unión de las 
imágenes de a y b. En particular (a U 6)(0) = a(0) y (a U 6)(1) = b(l). 

Esto significa que si podemos unir un punto x con un punto y a través de 
un arco a, y podemos unir un punto y con un punto z a través de un arco b, 
entonces podemos unir x con z mediante el arco a U b. 

Por otra parte, si a es un arco en un espacio X, la aplicación —a : [0, 1] — > X 
dada por (— a)(t) = a(l — t) es un arco con la misma imagen pero de modo que 
(— a)(0) = a(l) y (— a)(l) = a(0). También es obvio que un arco constante une 
un punto consigo mismo. 

De todo esto se sigue que la relación "x e y se pueden unir mediante un arco" 
es reflexiva, simétrica y transitiva en todo espacio X. 

Teorema 2.21 Sea X un espacio ¡ocalmente arco-conexo. Entonces un abierto 
de X es conexo si y sólo si es arco-conexo. 

DEMOSTRACIÓN: Obviamente los abiertos arco-conexos son conexos. Su- 
pongamos que A es un abierto conexo no vacío. Sea x € A. Sea U el conjunto 
de todos los puntos de A que pueden ser unidos con x mediante un arco conte- 
nido en A. 

Veamos que U es abierto (en X o en A, es lo mismo). Sea y £ U . Entonces 
existe un arco a en A tal que a(0) = x, a(l) = y. Como X es localmente arco- 
conexo existe un abierto arco-conexo V tal que y e V C A. Si z € V, entonces 
hay un arco b en V (luego en A) que une y con z, luego a U b es un arco en A 
que une x con z, luego z € U. 

Por lo tanto V C U y así U es un entorno de y. Tenemos, pues, que U es 
entorno de todos sus puntos, luego es un abierto. 

Ahora veamos que U es un cerrado en A, o lo que es lo mismo, que A \ U 
es abierto. Como U no es vacío, por conexión tendrá que ser U = A, lo que 
significa que A es arco-conexo. 

Si y G A\ U, entonces y no puede ser unido a x mediante un arco. Existe un 
abierto arco-conexo V tal que y € V C A, pero los puntos de V pueden unirse 
a y mediante un arco. Si alguno de estos puntos z pudiera unirse a x mediante 
un arco a, tendríamos un arco b que une a y con z y un arco a que une z con x, 
luego y se podría unir con x. Por lo tanto ningún punto de V puede unirse con 
x, es decir, V C A \ U, luego A \ U es abierto. ■ 

Una poligonal es una unión de un número finito de segmentos. Una pequeña 
modificación del teorema anterior permite probar que en un espacio localmente 
convexo, un abierto es conexo si y sólo se es conexo por poligonales, es decir, 
todo par de puntos se puede unir por una poligonal. 

Ahora vamos con las aplicaciones de la conexión. El resultado principal es 
el siguiente hecho obvio: 

Teorema 2.22 (Teorema de los valores intermedios) Si X es un espacio 
conexo, f : X — > R es una aplicación continua, x, y son puntos de X y 
f(x) < a < f(y), entonces existe un punto z G X tal que f(z) = a. 
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DEMOSTRACIÓN: Se cumple que f[X] es un conexo, luego un intervalo. 
Como f(x) y f(y) están en f[X], a también ha de estar en f[X]. m 

A pesar de su simplicidad, las consecuencias de este teorema son importantes. 
Por ejemplo, no hay polinomios irreducibles de grado impar sobre E, salvo los 
de grado 1: 

Teorema 2.23 Todo polinomio p(x) £ M[x] de grado impar tiene al menos una 
raíz en IR. 

Demostración: Como p(x) tiene una raíz si y sólo si la tiene —p(x), po- 
demos suponer que su coeficiente director es positivo. 

Entonces Km p(x) = +oo, mientras que Km p(x) = — oo. En particular 

X — > + OG X — > — OO 

existe un u £ IR tal que p(u) < 0 y existe un v € IR tal que p(v) > 0. Por el 
teorema de los valores intermedios también existe un a € IR tal que p(a) = 0. 

■ 

Por supuesto el teorema es falso para polinomios de grado par. Basta pensar 
en el caso x 2 + 1. 

Si a > 0, el teorema de los valores intermedios aplicado al polinomio x n — a 
nos permite concluir la existencia de un b > 0 tal que b n = a. Es claramente 
único, pues si b n = c n , entonces (b/c) n = 1, de donde b/c = ±1, luego si ambos 
son positivos b = c. 

Definición 2.24 Para cada natural n > 0 y cada número real a > 0 definimos 
la raíz n-sima de a como el único número b > 0 tal que b n = a. Lo representa- 
remos b = %/a 

Unas comprobaciones rutinarias muestran que si m, n son números enteros 
n > 0 y a > 0 entonces el número a m / n = ( \fa) m depende sólo de la fracción 
m/n, con lo que tenemos definida la exponencial a r para todo número real 
positivo a y todo número racional r y extiende a la exponencial entera. También 
se comprueba que a r+s = a r a s , (a r ) s = a rs . 

*Afinidades directas e inversas Las isometrías de un espacio afín euclídeo 
E se clasifican en movimientos y simetrías según que el determinante de la 
aplicación lineal asociada sea igual a 1 o a —1. La topología proporciona una 
interpretación geométrica de esta distinción puramente algebraica. En efecto, 
es conocido que todo movimiento (en dimensión mayor que 1) se descompone 
en composición de giros, y un giro es una aplicación / que en un sistema de 
referencia afín adecuado tiene la expresión: 

x\ = x\ cosa — x-i sena, 
x' 2 = xi sena + x 2 cosa 
4 = x 3, 
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Vamos a admitir la continuidad de las funciones trigonométricas. La demos- 
traremos en el capítulo III. 

Consideremos ahora la aplicación / : [0, 1] x E — ► E tal que si el punto 
x tiene coordenadas (xi, . . . ,x n ) en el mismo sistema de referencia, entonces 
ft(x) = f(t, x) es el punto de coordenadas (x[, . . . , x' n ) dadas por 

x\ = x\ eos ta — x 2 sen ta, 
x' 2 = X\ senía + x 2 eos ta 
x' 3 = x s, 

x n x n 

Claramente entonces, para cada t € [0,1], la aplicación f t es un giro de 
ángulo ta, de modo que /o es la identidad y /i = /■ Además la aplicación / es 
continua. Veamos que podemos obtener una aplicación similar para movimientos 
arbitrarios: 



Teorema 2.25 Si f es un movimiento en un espacio afín euclídeo E existe una 
aplicación continua / : [0,l]x£ — > E tal que para todo t € [0, 1], la aplicación 
ft(x) = f(t,x) es un movimiento, f 0 = 1 y fi = f ■ 

DEMOSTRACIÓN: Lo probamos por inducción sobre el número de giros en 
que se descompone /. Ya lo tenemos probado cuando / es un giro. Basta probar 
que si / cumple el teorema, g es un giro y h = fg entonces h cumple el teorema. 
Tenemos, pues, las aplicaciones f t y gt- Sea h : [0, 1] x E — > E dada por 



h(t, x) 



f(2t,x) si 0 < í < 1/2, 

g(2t-l,f(x)) si 1/2 < í < 1, 



La aplicación h es claramente continua en el cerrado [0,1/2] x E. Basta 
observar que su restricción al cerrado [1/2, 1] x E viene dada por g(2t— 1, f(x)), 
pues entonces también será continua en este cerrado y por consiguiente en todo 
su dominio. Ahora bien, los únicos puntos donde esta igualdad no es cierta por 
definición son los de la forma (1/2, x), pero 

h{l/2, x) = f{l,x) = f(x) = 5 (0, /(*)) = g(2 ■ (1/2) - l,f(x)) . 

El resto del teorema es obvio: para cada t la aplicación h t es de la forma f t > o 
gt' , luego es un movimiento, etc. ■ 

Este teorema se interpreta como que los movimientos pueden efectuarse de 
forma continua en el tiempo. El punto ft(x) se interpreta como la posición x en 
el instante t, de modo que para t = 0 tenemos la posición inicial x y para t = 1 
tenemos la posición final f(x). El arco f(t,x), para un x fijo, es la trayectoria 
que sigue x. El hecho de que cada f t sea un movimiento se interpreta como 
que en cada instante t las distancias entre los puntos son las mismas que las 
originales. 
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Ahora probamos que esta propiedad distingue a los movimientos de las se- 
mejanzas. 

Teorema 2.26 Si E es un espacio afín euclídeo y f : [0, 1] x E — > E es una 
aplicación continua tal que para todo t € [0, 1], la aplicación ft(x) — f(t,x) es 
una isometría y /o = 1, entonces todas las aplicaciones f t son movimientos. 

Demostración: Fijado un sistema de referencia afín en E, la aplicación 
h : E — > IR™ que a cada punto le asigna sus coordenadas es un homeomorfismo. 
La aplicación g : [0,1] xl° — > IR™ dada por g(t,X) = h(f(t,h- 1 (X)) es 
continua, y es de la forma g(t,X) = P t + XA t , donde P t g IR™ y A t es una 
matriz nxnde determinante ±1. 

La aplicación g'(t, X) = g(t, X)—g(t, 0) = XA t también es continua. Si e¿ es 
el vector i-ésimo de la base canónica, la aplicación gij(t) — g'(t, e^ej es continua, 
y gij(t) es simplemente el coeficiente de la matriz A t . El determinante de 
una matriz depende polinómicamente de sus coeficientes, por lo que la función 
det f t = det A t es continua. 

Ahora bien, si alguna f t fuera una simetría, det /o = det 1=1, mientras que 
det f t = det A t = —1. Tendrámos, pues, una aplicación continua y suprayectiva 
del espacio conexo [0, 1] en el espacio disconexo {—1, 1}, lo cual es imposible. 

■ 

Los mismos argumentos sirven para interpretar otros grupos de afinidades. 
Por ejemplo: 

Teorema 2.27 Si f es una biyección afín de determinante positivo en un espa- 
cio afín E existe una aplicación continua f : [0, 1] x E — > E tal que para todo 
t € [0, 1], la aplicación ft(x) = f(t,x) es una biyección afín, f 0 = 1 y fi = f ■ 

DEMOSTRACIÓN: Probaremos primero el teorema para automorfismos de 
determinante positivo del espacio vectorial asociado E. Cada uno de estos 
automorfismos se puede expresar como composición de una homotecia lineal 
de determinante positivo y un automorfismo de determinante 1. A su vez, 
estos automorfismos se descomponen en producto de transvecciones, es decir, 
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de aplicaciones de la forma f(x) = x + u(x)h, donde u : É — > IR es una 
aplicación lineal y h es un vector del núcleo de u. 
Para una transvección definimos 

f(t, x) = x + tu(x)h, 

que es una transvección para todo t, es continua como aplicación [0, 1] x E — > E, 

/:: I .V ./, /. 

Una homotecia lineal es de la forma f(x) = rx. Definimos la aplicación 
/(i, x) = (l + t(r - l))x. Como 1 + t(r — 1) > 0 siempre que r>0y0<í<l, 
tenemos que / t es una homotecia lineal para todo t. Claramente se cumplen 
también las otras propiedades. 

Aplicando la misma técnica de composición que en el caso de los movimientos 
llegamos a que todo automorfismo de E de determinante positivo cumple el 
teorema. 

Una biyección afín en E de determinante positivo es de la forma 

f(P) = 0 + v + f(OP), 

donde O es un punto arbitrario de E y / es un automorfismo de E de deter- 
minante positivo. Definimos f(t,P) = O + tv + f t (OP). Es fácil ver que esta 
aplicación cumple lo pedido. ■ 

El teorema es falso para biyecciones afines de determinante negativo, pues 
con el mismo argumento que hemos empleado para las simetrías se llega a que 
la aplicación det f t es una aplicación continua en el espacio conexo [0, 1] tal que 
det /o = 1, det f\ < 0 pero que nunca toma el valor 0, lo cual es imposible. Si 
un endomorfismo de E tiene determinante 0 su imagen tiene dimensión menor 
que E. Por consiguiente, cualquier aplicación que transforme continuamente un 
conjunto en su imagen por una biyección afín de E de determinante negativo, 
en un momento dado "aplanará" el espacio en una variedad afín de dimensión 
menor. ■ 



Orientación Los resultados que acabamos de ver nos llevan a introducir un 
concepto de orientación en un espacio vectorial (aunque casi todo el razona- 
miento que sigue es independiente de lo anterior). 

Definición 2.28 Diremos que dos bases ordenadas de un espacio vectorial real 
de dimensión finita V tienen la misma orientación si el determinante de la matriz 
de cambio de base es positivo. Alternativamente, si existe un isomorfismo de 
determinante positivo que transforma una en otra. 

Es inmediato comprobar que las bases de V se dividen en dos clases de 
equivalencia, a las que llamaremos orientaciones de V. Si una base tiene una 
determinada orientación, al cambiar de signo uno cualquiera de sus vectores 
pasamos a una base con la orientación opuesta. 
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Un espacio vectorial orientado es un espacio vectorial real de dimensión 
finita en el que hemos seleccionado una orientación, a la que llamaremos positiva, 
mientras que a la orientación opuesta la llamaremos negativa. Consideraremos a 
M. n como espacio orientado tomando como orientación positiva a la que contiene 
a la base canónica. 

Conviene notar que en otros espacios vectoriales, por ejemplo en los subespa- 
cios de R™, no hay ninguna base privilegiada que nos permita definir una orien- 
tación, luego la elección de una u otra como positiva es arbitraria. Lo mismo 
sucede con el espacio vectorial asociado a un espacio afín real, o con el espacio in- 
tuitivo, donde no tenemos bases canónicas. Para determinar una orientación en 
las representaciones gráficas hemos de recurrir a criterios no geométricos. Por 
ejemplo, si representamos la recta horizontalmente, se suele considerar como 
base positiva a la formada por el único vector unitario que apunta hacia la dere- 
cha. La distinción izquierda-derecha no tiene más fundamento que la anatomía 
humana. 

Para adoptar criterios similares de orientación 
en el plano y el espacio debemos notar primero que, 
según los resultados de la sección anterior, dos bases 
ortonormales tienen la misma orientación si y sólo si 
podemos transformar una en otra mediante un movi- 
miento continuo en el tiempo. Así, diremos que una 
base del plano es positiva si cuando el dedo índice 
derecho apunta en la dirección (y sentido) del primer 
vector (con la palma hacia abajo) entonces el pulgar 
(puesto en ángulo recto) apunta en la dirección del 
segundo vector. Si dos bases cumplen esto, el movimiento que transporta nues- 
tra mano de una a la otra justifica que tienen la misma orientación, y viceversa. 
Similarmente, consideraremos positivas a las bases ortonormales del espacio ta- 
les que podemos disponer la mano derecha con el dedo medio apuntando en la 
dirección del primer vector, el pulgar en la del segundo y el índice en la del 
tercero. Una forma equivalente y más cómoda de esta regla es la siguiente: Una 
base es positiva si cuando el índice derecho arqueado marca el sentido de giro 
que lleva del primer vector al segundo por el ángulo más corto, entonces el pul- 
gar apunta en la dirección del tercer vector. Una ligera modificación de estas 
reglas las hace válidas para bases cualesquiera, no necesariamente ortonormales. 

Si un vector v en un plano orientado tiene coordenadas (a, b) respecto a 
una base ortonormal positiva, entonces es claro que el vector w de coordenadas 
(—fe, a) es ortogonal al primero, con el mismo módulo y la base (v, w) es positiva. 
Vamos a obtener un resultado análogo en tres dimensiones. 

Sean v y w dos vectores en un espacio tridimensional orientado V. Sean 
(ai,a 2 ,a 3 ), (61,62,63) sus coordenadas en una base (ei,e 2 ,e 3 ) ortonormal y 
positiva. Definimos su producto vectorial vAw como el vector cuyas coordenadas 
en dicha base son 




ai a 3 
62 kí 



a 3 ai 
b 3 bi 



ai a 2 
bi h 
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Como regla mnemotécnica y de cálculo podemos usar: 



v A w = 



ei e 2 e 3 
ai a 2 a 3 
h b 2 b 3 



Hemos de probar que esta definición no depende de la elección de la base, 
siempre que sea positiva. Aunque con rigor el determinante anterior no tiene 
sentido (pues tiene vectores en su primera fila), sí hay una relación sencilla 
entre el producto vectorial y los determinantes que es útil para deducir sus 
propiedades. Si x es un vector de coordenadas (xi,x 2 ,x 3 ), entonces 



(x, u, v) = x(v A w) = 



Xl x 2 x 3 
ai a 2 a 3 
bi b 2 b 3 



donde este determinante sí tiene sentido. El escalar (x,u,v) se llama producto 
mixto de los vectores x,u,v, y es claro que no depende de la base ortonormal 
positivamente orientada que se escoja para calcularlo. Teniendo esto en cuenta 
es fácil probar hechos como que v A w ~ — w A v. En efecto, para todo x se 
cumple evidentemente x(v Aw) = — x(w A«), y esto sólo es posible si se da la 
relación indicada. Del mismo modo se prueban las relaciones 

vA(w + x)=vAw + vAx, av Aw = (o¿v) A w = v A (aw), a € K. 

Además v A w = 0 si y sólo si v y w son linealmente dependientes. En 
efecto, si son dependientes x(v A w) = 0 para todo x, luego v A w = 0. Si 
son independientes entonces existe un x independiente de ambos, de modo que 
x(v A w) ^ 0, luego uAaj^O. 

Si v y w son linealmente independientes, entonces vAw es un vector ortogonal 
a ambos. En efecto, v(v Aw) = w(v A w) = 0. Más aún, en general se cumple 

\\v A w\\ = \\v\\ || kj» || senvw. 

Para probarlo basta comprobar la identidad 

\\v A w\\ 2 + (vw) 2 



Il2 || 112 

v\\ \\w\\ , 



que junto con vw — ||u|| \\w\\ cosvw nos lleva a la relación indicada. 

Por último observamos que si v y w son linealmente independientes entonces 
la base (v, w, v A w) es positiva, pues el determinante de la matriz de cambio de 
base respecto a ei,e 2 ,e 3 es 



ai a 3 
b 2 b 3 



+ 



a 3 ai 
b 3 bi 



ai a 2 



> 0. 



Estas propiedades muestran que v Aw es independiente de la base respecto 
a la cual lo calculamos. Sea cual sea esta base, el producto vectorial resulta ser 
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el vector nulo si v y w son dependientes o bien el vector perpendicular a ambos 
cuyo módulo es el que hemos calculado y cuyo sentido es el necesario para que 
la base (v, w, v A w) sea positiva. 

Para terminar daremos una interpretación intuitiva del módulo del producto 
vectorial de dos vectores u y v. Se trata claramente del área del paralelogramo 
que los tiene por lados: 




2.3 Espacios completos 

La última propiedad que vamos a estudiar no es topológica, sino métrica. 
La completitud garantiza la convergencia de ciertas sucesiones sin necesidad de 
conocer su límite de antemano. Ya hemos encontrado algunos casos, como el de 
las sucesiones monótonas en IR, o las monótonas y acotadas en IR. Los criterios de 
este son muy útiles porque permiten definir nuevas funciones y constantes como 
límites de sucesiones. Comenzamos introduciendo una familia de sucesiones en 
un espacio métrico que incluye a todas las convergentes: 

Definición 2.29 Sea M un espacio métrico. Una sucesión {a n }^ =0 en M es 
una sucesión de Gauchy si para todo e > 0 existe un natural no de modo que si 
ra, n> n 0 , entonces d(a m ,a n ) < e. 

O sea, una sucesión es de Cauchy si sus términos están finalmente tan 
próximos entre sí como se desee. Esto le ocurre a toda sucesión convergente, 
pues si {a n }^ =0 converge a L, entonces dado e > 0 existe un natural no de modo 
que para todo n > no se cumple d(a n , L) < e/2, luego si m, n > n 0 se cumple 

d(a m ,a n ) < d{a m , L) + d(L, a n ) < | + | = e. 

Así pues, toda sucesión convergente es de Cauchy, pero el recíproco no es 
cierto. Pensemos en la sucesión {1/n} en el espacio ]0, 1]. Como en IR es 
convergente, es de Cauchy. Obviamente sigue siendo de Cauchy como sucesión 
en ]0, 1], pero ya no es convergente. 

Por supuesto que el problema no está en la sucesión, sino en el espacio, al 
que en cierto sentido "le falta un punto" . Los espacios a los que no les faltan 
puntos en este sentido se llaman completos: 

Un espacio métrico M es completo si toda sucesión de Cauchy en M es 
convergente. 

La completitud de IR es consecuencia de las siguientes propiedades obvias de 
las sucesiones de Cauchy: 

Teorema 2.30 Sea M un espacio métrico y {a„}^L 0 una sucesión de Cauchy. 



80 



Capítulo 2. Compacidad, conexión y completitud 



a) Si {a n }^ =0 tiene un punto adherente L, entonces converge a L. 

b) La sucesión {a n }^ =0 está acotada. 

DEMOSTRACIÓN: a) Dado e > 0, existe un número natural a partir del cual 
d(a m , a n ) < e/2, y existe también un natural n 0 , que podemos tomar mayor que 
el anterior, tal que d(a no ,L) < e/2. Por lo tanto si n > n 0 se cumple que 

d(a n ,L) < d(a n ,a no ) + d(a no ,L) <\ + \ = e - 

Por consiguiente la sucesión converge a L. 

b) Existe un n 0 tal que si n > n 0 , entonces d(a n , a„ 0 ) < 1, esto significa que 
{a n | n > rio} C Bi(a no ), luego es un conjunto acotado, y la sucesión completa 
es la unión de este conjunto con el conjunto de los no primeros términos, que es 
finito, luego también está acotado. Por lo tanto la sucesión está acotada. ■ 

Teorema 2.31 Todo espacio normado de dimensión finita es completo. 

DEMOSTRACIÓN: Una sucesión de Cauchy está acotada, luego está conte- 
nida en una bola cerrada, que es un conjunto compacto, luego tiene un punto 
adherente, luego converge. ■ 

En la sencilla prueba de este teorema se ve una relación entre la compacidad 
y la completitud. Con más detalle, la situación es la siguiente: 

Teorema 2.32 Se cumple: 

a) Todo espacio métrico compacto es completo. 

b) Todo cerrado en un espacio métrico completo es completo. 

c) Todo subespacio completo de un espacio métrico es cerrado. 

Demostración: a) Toda sucesión tiene una subsucesión convergente, luego 
si es de Cauchy es convergente. 

b) Si M es un espacio métrico completo y C es un cerrado en M, entonces 
toda sucesión de Cauchy en C converge en M, y como C es cerrado su límite 
estará en C, luego la sucesión converge en C. 

c) Si C es un subespacio completo de un espacio métrico M, dado un punto x 
en la clausura de C, existe una sucesión en C que converge a x, luego la sucesión 
es de Cauchy, luego converge en C, luego x está en C, luego C es cerrado. ■ 

Por supuesto no todo espacio completo es compacto. A veces es útil conocer 
lo que separa a un espacio completo de la compacidad: 

Definición 2.33 Un espacio métrico M es precompacto si para cada e > 0 
existen puntos x\, . . . , x n en M tales que M — B t (xi) U • • • U B € (x n ). 
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Obviamente todo espacio compacto es precompacto (basta extraer un sub- 
cubrimiento finito del cubrimiento formado por todas las bolas de radio e) . 

El teorema 2.7 contiene la demostración de que un espacio precompacto y 
completo es compacto. En efecto partiendo de la hipótesis sobre subsucesiones 
convergentes, en primer lugar se prueba que el espacio es precompacto. Con 
ayuda de la precompacidad se construye una sucesión de bolas Biu n+1 \(x n ) en 
las que podemos exigir que cada una de ellas corte a la anterior. Esto garantiza 
que la sucesión de los centros es de Cauchy, con lo que podemos garantizar su 
convergencia por la completitud y probamos la compacidad del espacio. Así 
pues: 

Teorema 2.34 Un espacio métrico es compacto si y sólo si es precompacto y 
completo. 

Es muy importante tener claro que la completitud es una propiedad métrica 
y no topológica. Por ejemplo, los espacios IR y ]— 1, 1[ son homeomorfos, pero 
uno es completo y el otro no. En particular una imagen continua de un espacio 
completo no tiene por qué ser completo. 

Si analizamos lo que falla, vemos que en ]— 1, 1[ hay sucesiones de Cauchy 
no convergentes, por ejemplo las que convergen a 1 en IR, pero cuando las trans- 
formamos por el homeomorfismo entre ] — 1, 1[ y K se convierten en sucesiones 
que tienden a +oo, que ya no son de Cauchy, luego no violan la completitud de 
K. El problema es que mientras una aplicación continua transforma sucesiones 
convergentes en sucesiones convergentes, no transforma necesariamente sucesio- 
nes de Cauchy en sucesiones de Cauchy. Y a su vez esto se debe a que si se 
estira infinitamente una sucesión de Cauchy, ésta deja de serlo. Esto nos lleva a 
conjeturar que la completitud se conservará por aplicaciones continuas que no 
produzcan estiramientos infinitos. Vamos a definir este tipo de aplicaciones. 

Definición 2.35 Una aplicación / : M — > N 
entre espacios métricos es uniformemente conti- 
nua si para todo e > 0 existe un 5 > 0 de modo 
que si x, y G M cumplen d(x, y) < S, entonces 
d(f(x),f(y))<e. 

Desde un punto de vista lógico, la diferencia 
entre aplicación continua y uniformemente conti- 
nua es sutil. Conviene confrontarlas. Recorde- 
mos que / es continua en un punto x si para todo 
e > 0 existe un 5 > 0 tal que si y € M cumple 
d(x,y) < 6, entonces d(f(x),f(y)) < e. 

La diferencia es, pues, que cuando / es unifor- 
memente continua el mismo 6 verifica la definición 
de continuidad para un e dado simultáneamente 
en todos los puntos x. Por ejemplo, el homeomor- 
fismo / entre ]— 1,1[ y R estira más los puntos 
cuanto más próximos están de ±1. Si tomamos 
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un punto x y queremos garantizar que f(z) diste de f(x) menos que e, tendre- 
mos que exigir que z diste de x menos que un cierto S, pero si consideramos 
los puntos que distan menos que 6 de un punto y más cercano a 1, vemos que 
muchos de ellos se transforman en puntos que distan de f(y) mucho más que 
e, y que si queremos que no sobrepasen esta cota hemos de tomar un 5 mucho 
menor. 

Teorema 2.36 Sea f : K — > M una aplicación continua entre espacios métri- 
cos y supongamos que K es compacto. Entonces f es uniformemente continua. 

DEMOSTRACIÓN: Sea e > 0. Para cada punto x € K, como / es continua 
en x, existe un 6(x) > 0 tal que si d(y,x) < 6(x), entonces d(f(y),f(x)) < e/2. 
Cubramos el espacio K por todas las bolas abiertas de centro cada punto a; y de 
radio 8{x)/2 y tomemos un subcubrimiento finito. Digamos que las bolas que 
forman este subcubrimiento tienen centros en los puntos x\, . . . ,x n . Sea <5 > 0 
el mínimo del conjunto {<5(a;i)/2, . . . , 6(x n )/2}. 

Si x, y son dos puntos cualesquiera de K tales que d(x, y) < S, entonces x 
estará en una de las bolas B S ( x .y 2 ( x i)- Entonces 

d(y, Xi) < d(y, x) + d(x, z¿) < + ^y- = S(xí). 
Por lo tanto x, y € S¿( x .)(a;,), de donde 

d(f(x)J( Xl ))< e -, d(f(y)J(x t )) <"-. 

Consecuentemente, d[f(x),f(y)) < e. m 

La imagen de una sucesión de Cauchy por una aplicación uniformemente 
continua es una sucesión de Cauchy. En efecto, si {a„}^L 0 es de Cauchy y 
/ es uniformemente continua, dado e > 0 existe un S > 0 de manera que si 
d(x,y) < 6, entonces f(y)) < e. Existe un natural no tal que si n, 

m> n 0 entonces d(a m , a n ) < 6, luego d(/(a m ), /(a„)) < e. Esto prueba que la 
sucesión {/(a„)}^L 0 es de Cauchy. 

Como consecuencia, si dos espacios métricos X e Y son uniformemente ho- 
meomorfos, esto es, si existe una biyección uniformemente continua con inversa 
uniformemente continua entre ellos, uno es completo si y sólo si lo es el otro. 

Es importante destacar que una imagen uniformemente continua de un es- 
pacio completo no tiene por qué ser completa. 

Veamos ahora algunas propiedades de las aplicaciones lineales entre espacios 
normados. 

Teorema 2.37 Sea f : E — > F una aplicación lineal entre espacios normados. 
Las siguientes condiciones son equivalentes: 

a) f es continua en E. 

b) f es continua en 0. 
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c) f está acotada en -Bi(O). 

d) Existe un M > 0 tal que para todo x G E se cumple \\f(x)\\ < M||x||. 

e) f es uniformemente continua en E. 
Demostración: a) — > b) es obvio. 

b) — > c), pues existe un 5 > 0 tal que \\x — 0| < <5, entonces ||/(x) — /(0)| < 1. 
Por lo tanto si ||x| < 1, se cumple ||<5x| < 8, ||/(<5x)|| < 1, ||/(ar)|| < 1/8, o 

sea, que 1/8 es una cota de / en i?i(0). 

c) — > d), pues si M es una cota de / en £?i(0), dado cualquier x ^ 0 se 
cumple que x/\\x\\ € Bi(0), luego ||/(x/||x||)|| < M, de donde ||/(x)|| < M||x||, 
y esto también es cierto si x = 0. 

d) — > e), pues para todos los x, y en E: 

\\f(x) -f(y)\\ = \\f(x-y)\\<M\\x-y\\, 

luego dado e > 0, si \\x — y\\ < e/M, se cumple \\f(x) — f(y)\\ < e. 

e) — > a) es evidente. ■ 

En particular, todo isomorfismo entre dos K-espacios vectoriales de dimen- 
sión finita es un homeomorfismo uniforme para cualquier par de normas. 

Definición 2.38 Un espacio de Banach es un espacio normado completo. 

Hemos visto que todo espacio normado de dimensión finita es un espacio de 
Banach. 



2.4 Espacios de Hilbert 

En el capítulo I introdujimos los espacios prehilbertianos, que son los K- 
espacios vectoriales dotados de un producto escalar. 

Definición 2.39 Un espacio de Hilbert es un espacio prehilbertiano H que sea 
completo con la métrica inducida por el producto escalar. 

Vamos a probar algunos hechos de interés sobre espacios de Hilbert. Los 
primeros son válidos en general sobre espacios prehilbertianos: 

Teorema 2.40 Si H es un espacio prehilbertiano, entonces el producto escalar 
en H es una función continua. 

Demostración: Para todos los x, x', y, y' e H se cumple 

\x ■ y - x' ■ y'\ < \(x - x') ■ y\ + \x' ■ (y - y')\ < \\x - x'\\ \\y\\ + \\x'\\ \\y - y'\\ 

< \\ x - x '\\ \\y\\ + \W - x \\ \\v - y'W + h - v'W 

Así, dado un par (x, y) € H x H y un e > 0, todo par (x' , y') £ H x H que 
cumpla Ha;' — ar||, \\y' — y\\ < e/3M, donde M > \\x\\, \\y\\, cumple también que 

e e 2 e 

\x ■ y - x' ■ y'\ < —— M + — — r + — — M < e. 
1 y y 1 3M 9M 2 3M 
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Definición 2.41 Si H es un espacio prehilbertiano, diremos que x, y £ H son 

ortogonales, y lo representaremos por x _L y, si x ■ y = 0. 

Es conocido que la ortogonalidad en R n coincide con el concepto geométrico 
de perpendicularidad. Es fácil generalizar el teorema de Pitágoras: 



Si x _L y, entonces \\x + y\\ 2 = \\x\\ 2 + \\y\ 



2 



Así mismo, las propiedades del producto escalar dan inmediatamente la 
fórmula conocida como identidad del paralelogramo: 

\\x + y\\ 2 + \\x-y\\ 2 = 2\\x\\ 2 + 2\\y\\ 2 . 

Para cada A C H , definimos 

A 1 - = {x £ H \ x ± a para todo a € A}. 

Es claro que A 1 - es un subespacio vectorial de H. Más aún, puesto que {aj- 
es la antiimagen de 0 por la aplicación continua x a ■ x, se cumple que {a} 1 - 
es cerrado, y como 

A^=f]{a}\ 

a£A 

vemos que A es un subespacio cerrado de H. 

Si V es un subespacio vectorial de H es claro que V H V 1 - = 0. Vamos a 
probar que si V es cerrado entonces H = V 0 V 1 - . Para ello necesitamos un 
resultado previo: 

Teorema 2.42 Sea M un subconjunto no vacio, cerrado y convexo de un espa- 
cio de Hilbert H. Entonces M contiene un único elemento de norma mínima. 

DEMOSTRACIÓN: Sea 5 el ínfimo de las normas de los elementos de M. 
Aplicando la identidad del paralelogramo a \x, \y tenemos 



s ll*-y|| +2> 



2 

y 



2 

Si x, y € M, por convexidad (a; + y) ¡2 € M, luego 

1 1 ízt — 2/| | 2 < 2||a;|| 2 + 2||y¡| 2 -AS 2 . (2.1) 

Si ||x| = ||y|| = S esto implica x = y, lo que nos da la unicidad. Es fácil 
construir una sucesión {x„}^ 0 C M tal que lím ||x n || = S. Aplicando 2.1 a x m 

n 

y i n concluimos fácilmente que la sucesión es de Cauchy, luego converge a un 
punto x que, por continuidad de la norma, cumplirá ||x|| = 5. Además, como M 
es cerrado, ha de ser x € M y claramente su norma es la mínima en M. ■ 



Teorema 2.43 Sea V un subespacio cerrado de un espacio de Hilbert H. En- 
tonces 
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a) Todo x € H se descompone de forma única como x = Px + Qx, donde 
Px e V, Qx e V^. 

b) Px y Qx son los puntos de V y V más próximos a x. 

c) Las aplicaciones P : H — > V y Q : H — > V 1 - son lineales y continuas. 

d) \\x\\ 2 = \\Pxf + \\Qx\\ 2 . 

DEMOSTRACIÓN: El conjunto x + V es cerrado y convexo, luego podemos 
definir Qx como el elemento de norma mínima en x + V. Definimos Px = 
x — Qx. Obviamente Px € V. Veamos que Qx £ V a -. Para ello probaremos que 
(Qx) ■ y = 0 para todo y € V. No perdemos generalidad si suponemos ||y|| = 1. 
Por definición de Qx tenemos que 

(Qx) ■ (Qx) = \\Qx\\ 2 < \\Qx - ay\\ 2 = (Qx - ay) ■ (Qx - ay), 

para todo a£l. Simplificando queda 

0 < — a(y • Qx) — á(Qx ■ y) + aá, 

y si hacemos a = (Qx) ■ y queda 0 < — \(Qx) ■ y\ 2 , luego (Qx) ■ y = 0. 

Esto prueba la existencia de la descomposición de a). La unicidad se debe a 
que V n V 1 - = 0. En definitiva, H = V © V^. 

Ahora observamos que si y € V entonces 

II* - y\\ 2 = WQx + (P^ -y)\\ 2 = WQxf + \\Px- y|| 2 , 

luego la mínima distancia entre x y un punto y € V se alcanza cuando y = Px. 
Esto prueba b). El apartado d) es el teorema de Pitágoras. La linealidad de 
P y Q es obvia. La continuidad se debe a que por d) tenemos ||Pa;|| < 
IIQ^II < \\x\\, y basta aplicar el teorema 2.37. ■ 

Terminamos con un teorema que caracteriza las aplicaciones lineales conti- 
nuas de un espacio de Hilbert en K. 

Teorema 2.44 Sea H un espacio de Hilbert y f : H — > K una aplicación 
lineal continua. Entonces existe un único y G H tal que f(x) = x ■ y para todo 
xeH. 

DEMOSTRACIÓN: Si / es la aplicación nula tomamos y = 0. En otro caso 
sea V el núcleo de /, que será un subespacio cerrado propio de H . Por el 
teorema anterior V 1 - ^ 0, luego podemos tomar z € V 1 - con = 1. Sea 
u = f(x)z — f(z)x. Como f(u) = ¡(x)f(z) — f(z)f(x) = 0, tenemos que u EV, 
luego u ■ z = 0. La definición de u implica 

f(x) = f(x)(z-z) = f(z)(x-z). 

Tomando y — f(z) z resulta f(x) = x ■ y. 

La unicidad es obvia, pues si dos puntos y, y' cumplen el teorema, entonces 
y — y' es ortogonal a todo x € H. ■ 



8G 



Capítulo 2. Compacidad, conexión y completitud 



2.5 Aplicaciones a las series numéricas 

La completitud de K tiene muchas consecuencias sobre las series numéricas. 
En primer lugar, la condición de Cauchy para una serie en K puede expresarse 
como sigue: 

oo 

Teorema 2.45 Una serie E a n en K es convergente si y sólo si para todo 

p 

e > 0 existe un natural no tal que sí n a < m < p, entonces 



E a n 



< e. 



p 

Demostración: Se trata de la condición de Cauchy, pues E a « es ^ a 

n—m 

diferencia entre la suma parcial p-ésima menos la suma parcial ra — 1-sima, y 
su módulo es la distancia entre ambas. ■ 

De aquí se sigue un hecho importantísimo. 

oo oo 

Teorema 2.46 Sea E a n wraa serie en K. Si la serie E \ a n\ es convergente, 

oo 

entonces la serie E a « también lo es. 

n=0 

DEMOSTRACIÓN: Dado e > 0 existe un número natural no de manera que 

p 

si n 0 < m < p, entonces E l°nl < e - 

n—m 
P P 

Ahora bien, E a n < E l a n| < e , luego la serie sin módulos también es 

n=m n—m 

de Cauchy, luego converge. ■ 

oo 

Definición 2.47 Una serie E a n enK es absolutamente convergente si la serie 
\ a n\ es convergente. 

n=0 

Hemos probado que toda serie absolutamente convergente es convergente. 
Las series convergentes que no son absolutamente convergentes se llaman series 
condicionalmente convergentes. 

Un ejemplo de serie condicionalmente convergente es 

La convergencia absoluta de una serie es esencial para ciertas cuestiones. Por 
ejemplo, una consecuencia inmediata de las propiedades de las sumas finitas y 
de los límites de sucesiones es que 

oo oo oo oo oo 

^ o>n + ^ K = ^2(a n -\-b n ), a^2a n = J^aa n , 

n=0 n—0 n—0 n— 0 n— 0 
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entendiendo que si las series de la izquierda convergen, las de la derecha también 
lo hacen y se da la igualdad. Un resultado análogo para producto de series ya 
no es tan sencillo. 

oo oo 

Definición 2.48 Sean ^ a n y ^2 b n dos series en K. Llamaremos producto 

77=0 77=0 

oo / n 

de Cauchy de estas series a la serie ( ^2 a k • °n-k 

77=0 \fc=o 

La intención es que la serie que acabamos de definir converja al producto de 
las dos series de partida, pero esto no ocurre necesariamente si al menos una de 
ellas no converge absolutamente. 

oo oo 

Teorema 2.49 Si ^2 a n y ^2 b n son dos series convergentes en K al menos 

77=0 n=0 

una de las cuales converge absolutamente, entonces 

oo / n \ / oo \ / oo\ 



53 J2 ak - bn - k = 53 a « 53 6 « 



77=0 \k=0 / \n=0 / \n=0 / 

DEMOSTRACIÓN: Supongamos que la serie que converge absolutamente es 

oo 

^2 a n y definamos 

71=0 

oo oo tí n 

A = ^a n , B = ^b n , c n = 53 afe ■ 6„_ fe , C n = 53c fc , 

77=0 71 = 0 fc = 0 fc=0 

77 77 

^7i = 53 flfe ' B n = 53 b kl ¡3 n = B n - B. 
fc=0 fc=o 

Ahora, 

C n = c Q -\ h c„, = a 0 b Q + (a 0 bi + aib 0 ) H h (a 0 b n H h a n b 0 ) 

= a Q B n + ■■■ + a n B 0 = a 0 (B + /?„) + ••• + a n (B + /3 0 ) 
= A n B + (a 0 f3 n + ■■■ + a n /3 0 ) 

El teorema quedará probado si vemos que a 0 f3 n + ■ ■ ■ + a n j3o tiende a 0. 

oo 

Sea e > 0. Sea K = Yl \ a n\- Sea M = sup{|/3„| | n > 0} (la sucesión j3 n 

77=0 

tiende a 0, luego está acotada). 

Existe un número natural n 0 tal que si n > n 0 , entonces \f3 n \ < e/2K y si 
<i 

k > n 0 , entonces J2 l a fc| < e/2M. En consecuencia, si n > 2no, 

fc = 77o + l 

77 77 o 77 

\aob n -\ \-a n b 0 \ < 53 \ a kPn-k\ = 53 \ a kPn-k\ + 53 \ a kPn-k\ 

k=0 k=0 fc=77 0 + l 

77 77 

< é53 |afel + M 53 ^^é K+ út M = e - 

k—0 k— rto + 1 
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Si ninguna de las series converge absolutamente el resultado no tiene por 
qué cumplirse. 

Ejemplo Consideremos la serie 

(-1)" 



La serie converge por el criterio de Leibniz. El producto de Cauchy de esta 
serie por sí misma tiene término general 

n , 
Cn = (-1)" y . 

Cuando n> k tenemos 

(n- fc+ l)(. + l)^(¡ + l) 2 -(f- fc ) 2 <(f + l) 2 , 

luego 

1 1 2 

> 



y/(n-k+l)(k+l) - i + 1 n+2 
Por consiguiente 

'"'"f-n + 2 n + l 

Esta expresión converge a 2, luego c„ no converge a 0 y el producto de 
Cauchy no converge. 

El teorema anterior prueba, pues, que la serie dada es condicionalmente 
convergente. ■ 

Otro punto en el que la convergencia absoluta resulta crucial es en el de la 
reordenación de los términos de una serie. 

oo 

Dada una serie convergente a n y una biyección a : N — > N, podemos 

oo 

considerar la serie ^ a a (n) y estudiar su convergencia. De nuevo el resultado 

n=0 

natural exige que la serie converja absolutamente: 

oo 

Teorema 2.50 Si a n es una serie absolutamente convergente y a : N — > N 

oo 

es una aplicación biyectiva, entonces la serie ^ a a(n) es absolutamente conver- 
gente y tiene la misma suma. 

Demostración: Una serie es absolutamente convergente si y sólo si las 
sumas parciales de sus módulos forman un conjunto acotado. Toda suma parcial 
de los módulos de la reordenación está mayorada por una suma parcial de los 
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módulos de la serie original (tomando los sumandos necesarios para incluir todos 
los que aparecen en la suma dada) . Por tanto las sumas parciales de los módulos 
de la reordenación están acotadas y la serie converge absolutamente. 
Sea e > 0. Existe un número natural n 0 tal que si n > n 0 



n oo 




oo 


Y ° fc ~ Y ük 




Y ük 


k=0 k=0 




k—n 



< Y i afe i = Y i afc i ~ Y i afe i < 



k—n 



k=0 



k=0 



Sea m 0 > n 0 tal que {0, 1, 

n > m 0 , 



Y a °( k ) - Y ak 

k=0 k=0 



< 



< 



■ . , n 0 } C {cr(0), er(l), . . . , a(m 0 )}. Entonces si 



Y a °( k ) ~Y ak 

k=0 



k=0 

oo 



Y a k-Y ük 

k=0 



k=0 



Y 

k— no + 1 



\ a k\ + 2 <e - 



Por lo tanto Y a <r(fe) = J2 a k- ■ 

k=0 k=0 

Como consecuencia, si / es cualquier conjunto infinito numerable y {a¿}¿ e / 

es cualquier familia de elementos de K con la propiedad de que las sumas Y | ct¿ | , 

íef 

con F C I finito estén acotadas, tiene sentido la expresión Y &i, definida como 

la suma de la serie determinada por cualquier ordenación del conjunto /, y es 
un número independiente de la ordenación elegida. Obviamente la expresión 

Y cti tiene también sentido cuando / es un conjunto finito. 

iei 

Observar que si e > 0, existe un F 0 C / finito tal que para todo F 0 C F C /, 



se cumple 



< e. En efecto, basta considerar una ordenación de / 



E a ¡ - S a ¿ 

iei íef 

y tomar como Fo los primeros términos de la sucesión, de modo que el módulo 
de las colas con y sin módulos sea menor que e/2. Entonces 



Y a *-Y a < 



¿6/ 



< 



J2 a * - Y ai 

iei ieF 0 



Y ^-Y^ 

teF 0 íef 



< \ + Y n < e - 

i£F\F 0 



Las series absolutamente convergentes se pueden manipular exactamente 
igual que si fueran sumas finitas. El siguiente teorema justifica cualquier ope- 
ración razonable entre ellas. 

oo 

Teorema 2.51 Sea {a¿}¿ 6 / una familia de elementos de K. Sea I = [j I n una 

_ n=0 

división de I en partes disjuntas. Entonces Y a i es (absolutamente) convergente 

iei 

oo 

si y sólo si lo son las series Y a i U \ a i\- Además en tal caso 

ieln n=0 



E fl ' = EE tt - 

iei n=oiei n 
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DEMOSTRACIÓN: Si Y a i es absolutamente convergente, sus sumas parciales 

te/ 

en módulo están acotadas, pero toda suma parcial en módulo de cada Y \ a i\ 

iei„ 

lo es también de la primera, luego éstas están acotadas, o sea, las series Y l a ¿l 

iein 

convergen absolutamente. Dado cualquier natural k, tomamos para cada n < k 

un conjunto finito F n C I n tal que Y — Y < + 1)- Entonces 

iei n ieF n 

k k 

E E n < E E + 1 ^ E n + 

n=0¿£/„ n=0i£F rl i£l 

luego las sumas parciales están acotadas y así todas las series convergen abso- 
lutamente. 

oo 

Supongamos ahora que las series Y \ a i\ Y S l a ¿l convergen absoluta- 

¿e/„ n=o¿e/„ 

mente. Si F C / es finito, para un cierto k suficientemente grande se cumple 

k k oo 

Eh = E E ki<EEi a ^EEH> 

ieF n=0i£l n nF n=0iel n n=0iel n 

luego las sumas parciales de Y l a ¿l están acotadas y la serie converge absoluta- 

iei 

mente. 

Ahora supongamos la convergencia de todas las series y probemos la igualdad 
de las sumas. Notemos que la serie 

oo 

EE a * 

n=0 iel n 

es convergente porque es absolutamente convergente. Sea e > 0. Existe un 
número natural n 0 tal que 



E I> 

n=n 0 + l i£/„ 



< e/4. 



Para cada n < no existe un conjunto finito F n C I n tal que si F„CÍC I n , 
entonces 



E a * ~ E a < 

iein ÍCFn 



< 



2(n 0 + 1) 

Sea F un conjunto finito que contenga a todos los F n y tal que 



E a * ~E' 



< e/4. 



i&F 
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Entonces 



EE a *-E as 

n=0i£l n iel 



< 



+ 



< 



E E a * 

n=no + l 



+ 



n=0¿6/„ í£F 



E°* -E a * 

"o / 

E E a *- E a * 



n=0 \íe/„ 
Por lo tanto ambas sumas coinciden. 



ie/„nF 



e e e 
4 + 2 + 4 



= e. 



Ejemplo Consideremos la serie condicionalmente convergente 

(_l)"+i 
n 

Entonces 

E 



* = E 

(-1)" +1 _ s 
2n ~ 2 ' 

n— 1 



Ahora consideremos la serie ^ a„ cuyos términos impares son ceros y sus 



n=l 

términos pares son los de la serie anterior, es decir, la serie 

0 + 1 + 0-1 + 0 + 1 + 0-1 + ... 

Obviamente su suma es también 5/2. La serie 

n=l v 

converge a 35/2. Sus primeros términos son: 

111 111 

i + o + --- + - + o + --- + - + o + ... 

Eliminando los ceros obtenemos la serie 

.111111 1 1 

+ 3~2 + 5 + 7~4 + 9 + TT~6"' 

Vemos que se trata de una reordenación de la serie original, pero converge a 
35/2. ■ 
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2.6 Espacios de funciones 

Uno de los éxitos de la topología consiste en que sus técnicas, desarrolladas en 
principio para estudiar espacios "geométricos" como K n , se aplican igualmente 
a objetos más abstractos, como son los conjuntos de funciones entre espacios 
topológicos. Las definiciones siguientes no corresponden en realidad a conceptos 
nuevos desde un punto de vista topológico: 

Definición 2.52 Sea Y un espacio topológico y X un conjunto cualquiera. Una 
sucesión funcional de X en Y es una sucesión {f n }^Lo en el espacio Y x de todas 
las aplicaciones de X en Y, es decir, para cada n se cumple /„ : X — > Y. 

Si Y es un espacio vectorial topológico (en especial si Y — K) cada sucesión 

oo 

funcional define la correspondiente serie funcional Yl fn, es decir, la sucesión 

n=0 

n 

cuyos términos son las funciones S n — fk ■ X — > Y. 

Diremos que una sucesión funcional {fn\n°=o converge puntualmente a una 
función / G Y x si para todo x <G X se cumple lím/„(x) = f(x). En tal caso 

n 

escribiremos lím f n — f. Para series de funciones podemos definir de manera 

n 

obvia la convergencia puntual absoluta y la convergencia puntual condicional. 

En realidad no estamos introduciendo un nuevo concepto de convergencia. 
Notemos que Y x es el producto cartesiano del espacio Y por sí mismo tantas 
veces como elementos tiene X, luego podemos considerarlo como espacio to- 
pológico con la topología producto. Las sucesiones convergen en esta topología 
si y sólo si convergen coordenada a coordenada, o sea, si y sólo si convergen 
puntualmente. Por ello a la topología producto en Y x se la llama también 
topología de la convergencia puntual. 

Sin embargo, la convergencia puntual no es la convergencia más natural que 
puede definirse sobre las sucesiones funcionales. De hecho presenta grandes 
inconvenientes. 

Ejemplo Para cada n > 1 sea /„ : R — > R la función dada por 

í 0 si x < 0 
fn{%) = { nx si 0 < x < 1/n 
[ 1 si 1/n < x 

6 Si x < 0 entonces f n (x) es constante igual a 0 y si 

x > 1 entonces f n (x) es finalmente constante igual a 1, 
luego esta sucesión funcional converge puntualmente a la 

* 1 función / que muestra la figura de la izquierda. Tenemos, 

pues, una sucesión de funciones continuas cuyo límite puntual no es continuo. 
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En general el hecho de que una función sea límite 
puntual de una sucesión de funciones aporta muy 
poca información. La razón es que los entornos de 
la topología puntual son muy grandes. En efecto, en 
el caso de M R no es difícil ver que un entorno básico 
de una función f es un conjunto de la forma 

{ge R R | \g(xí) - f( Xi )\ < e, i= l,...,n}, 

donde e > 0 y x\, . . . , x n e IR, es decir, si una sucesión funcional tiende a /, lo 
máximo que podemos garantizar tomando un índice grande es que los términos 
de la sucesión se parecerán a / en un número finito de puntos, pero dos funciones 
pueden parecerse en un número finito de puntos y ser muy diferentes. 

Es mucho más natural considerar que dos funciones están próximas cuando 
distan menos de un e en todos los puntos a la vez. Por ello, si Y es un espacio 
métrico, definimos la topología de la convergencia uniforme en Y x como la que 
tiene por base de entornos abiertos de una función / a los conjuntos de la forma 

B (.f> e ) = Í9 € Y X I d(f(x),g(x)) < e para todo x e X}. 

De este modo, cuando una función g está en un entorno de / suficientemente 
pequeño, ambas funciones se parecen realmente. Es fácil comprobar que los 
conjuntos B(f, e) cumplen las condiciones del teorema 1.14 y por tanto definen, 
según hemos dicho, una topología en Y x . 

Es inmediato comprobar que una sucesión funcional {f n }^Lo converge uni- 
formemente (es decir, en la topología de la convergencia uniforme) a una función 
/ si y sólo si para todo e > 0 existe un n 0 tal que si u > n 0 , entonces 
d(f n (x), f(x)) < e para todo x € X. 

La diferencia, pues, entre la convergencia uniforme y la convergencia puntual 
es que cuando la convergencia es uniforme hay un n 0 a partir del cual todos los 
f n (x) distan de su límite menos de un e dado, mientras que si la convergencia 
es puntual cada punto x puede requerir un n 0 mayor para acercarse a su límite 
en menos de e, de manera que ningún n 0 sirva simultáneamente para todos los 
puntos. 

Es obvio que si una sucesión funcional converge uniformemente a una fun- 
ción, también converge puntualmente a dicha función. Tanto la topología de 
la convergencia uniforme como la topología de la convergencia puntual son de 
Hausdorff, luego los límites son únicos. 

Si en el espacio Y tomamos la distancia d'(x 7 y) = mín{l, d(x, y)}, los con- 
juntos B(f, e) son los mismos cuando e < 1, luego d! induce la misma topología 
de convergencia uniforme en Y x . 

La ventaja de esta métrica es que no toma valores mayores que 1, por lo que 
podemos definir 

d(f,g)=sup{d'(f(x),g(x)) \ xeX}, 

y es claro que esta d es una distancia en Y x para la cual B(f, e) es simplemente 
la bola abierta de centro / y radio e. Esto convierte a Y x en un espacio métrico 
cuya topología es precisamente la de la convergencia uniforme. 
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Teorema 2.53 Sea X un espacio topológico e Y un espacio métrico. Entonces 
el conjunto C(X, Y) de las aplicaciones continuas de X en Y es cerrado en Y x , 
cuando en éste consideramos la topología de la convergencia uniforme. 

Demostración: Sea {/„}^L 0 una sucesión de aplicaciones continuas que 
converja uniformemente a una función /. Basta ver que / es continua. 

Sea e > 0. Sea no tal que si n > no y x £ X, entonces d(f n (x), f(x)) < e/3. 

Sea xq € X (vamos a probar que / es continua enio)- Como /„ 0 es continua 
existe un entorno U de x 0 tal que si x € U, entonces d(f no (x), f no (x 0 )) < e/3. 
Por lo tanto, si x £ U, se cumple que 

d{f(x),f(x 0 )) < d(f(x),f no (x)) + d(f no (x),f no (xo)) + d(f no (x 0 ), f(x 0 )) < e. 

■ 

Este es un primer ejemplo del buen comportamiento de la convergencia uni- 
forme. Veamos otros: 

Teorema 2.54 Sea Y un espacio métrico completo y X un conjunto. Entonces 
Y x es completo con la métrica inducida a partir de la métrica de Y. Por lo 
tanto si X es un espacio topológico, C(X, Y) también es completo. 

Demostración: Ante todo notemos que si Y es completo con su métrica 
d, también lo es con la métrica d' que resulta de tomar el mínimo con 1, luego 
podemos suponer que la métrica en Y está acotada. 

Sea {/n}^Lo una sucesión de Cauchy en Y x . Esto significa que para todo 
e > 0 existe un no tal que si m, n > no y x S X, entonces d(f m (x), f n (%)) < e. 

En particular esto implica que cada sucesión {/ n (a;)}^Lo es de Cauchy en Y, 
luego converge a un cierto punto f(x). Con esto tenemos una función / e Y x 
a la cual {f n }^Lo converge puntualmente. Basta ver que también converge 
uniformemente . 

Sea e > 0 y tomemos un natural n 0 como antes. Así, si n 0 < n < ni, 
se cumple d(f m (x),f n (x)) < e, luego f m (x) está en la bola cerrada de centro 
f n {x) y radio e, luego el límite f(x) estará en esta misma bola, o sea, se cumplirá 
d(.f(x), f n (x)) < e, y esto para todo n > n 0 y todo x £ X. Esto significa que la 
sucesión converge uniformemente a /. La completitud de C(X,Y) se sigue de 
que es un cerrado. ■ 

En general no podemos convertir a Y x en un espacio normado aunque Y 
lo sea. El problema es que no podemos transformar la norma en una norma 
acotada. Lo único que podemos hacer es definir (Y x )* como el espacio de 
las funciones acotadas de X en Y, es decir, las funciones / tales que f[X] 
está acotado. En este conjunto podemos definir la norma supremo dada por 
ll/lloo = sup{ || sel}, que obviamente genera las bolas que definen 
la topología de la convergencia uniforme (restringida a (Y x )*). Así pues, si Y 
es un espacio normado, (Y x )* también lo es, y como es fácil ver que el límite 
uniforme de funciones acotadas está acotado, resulta que (Y x )* es cerrado en 
Y x , luego si Y es un espacio de Banach, (Y x )* también lo es. 
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Si X es un espacio topológico e Y es un espacio normado, definimos C* (X, Y) 
como el espacio de las funciones continuas y acotadas de X en Y. Obviamente se 
trata de la intersección de dos cerrados, luego es cerrado, es un espacio normado 
y si F es un espacio de Banach, C*(X, Y) también lo es. 

En particular C*(X,K) es un espacio de Banach. En general no podemos 
dotar a C(X,K) de estructura de espacio normado. De hecho no es un espacio 
vectorial topológico porque no es conexo. En efecto, es fácil ver que C*(X,K) 
es abierto y cerrado en C(X,K). La única excepción es precisamente cuando 
C(X, K) = C*(X,K). Esto ocurre por ejemplo si X es un compacto. Es decir, 
si X es compacto, entonces C(X,K) es un espacio de Banach con la norma 
supremo y la topología es la de la convergencia uniforme. 

Sea L(E, F) el conjunto de las aplicaciones lineales continuas entre dos espa- 
cios normados. Teniendo en cuenta 2.37, la aplicación L(E 7 F) — > C*(Bi(Q),F) 
definida por restricción es claramente lineal e inyectiva (pues Bi(0) contiene una 
base de E) . Si transportamos la norma de este segundo espacio al primero ob- 
tenemos que, para cada aplicación lineal y continua / : E — > F, su norma es 
el supremo de / en B\(0), y por lo tanto cumple ||/(w)| < ||/|| \\v\\ para todo 
v e E. 

Ejercicio: Probar que L(E, F) es un subespacio cerrado de C*(Bi(0), F). Por consi- 
guiente, si F es un espacio de Banach, L(E, F) también lo es. 

Terminamos con un resultado importante sobre convergencia de series funcio- 

oo 

nales. Previamente notemos lo siguiente: si una serie ^] f n converge absoluta 

oo 

y uniformemente en un conjunto X, es decir, si la serie \fn\ converge úni- 
co n=0 

formemente, entonces fn converge uniformemente. La prueba es la misma 
que la de 2.46. ™ =0 

oo 

Teorema 2.55 (Criterio de Mayoración de Weierstrass) Sea fn una 

serie funcional en un espacio X y {M n }í¡fL 0 una sucesión en el intervalo [0, +oo[ 
tal que para todo natural n y todo x G X se cumpla \f n (%)\ < M n . Si la 

oo 

serie ^ M n es convergente, entonces la serie f n es absoluta y uniformemente 
convergente en X. 

Demostración: La serie M n es de Cauchy, luego dado e > 0 existe un no 

v 

tal que si n 0 < ra < p, entonces M n < e. Así 

n—vci 

¿i/n(z)| =¿i/ n (x)|<¿M„<6 
n—m n—m n—m 

oo 

para todo x e X. Esto significa que la serie Yl \fn\ es de Cauchy en C(X, K), 
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oo 

luego (uniformemente) convergente, luego ^ f n es absoluta y uniformemente 

n=0 

convergente. ■ 



2.7 Apéndice: El teorema de Baire 

Terminamos el capítulo con un resultado que no nos va a hacer falta más 
adelante, pero que es útil en algunos contextos más avanzados. Necesitamos 
algunos resultados previos: 

Definición 2.56 Si M es un espacio métrico y C C M, se define el diámetro 
de C como 

d(C) = snp{d(x,y) | x, y € C} € [0,+oc]. 
Es fácil calcular el diámetro de una bola abierta: 

d(B r (x)) = 2r. 

También se comprueba sin dificultad que el diámetro de un conjunto coincide 
con el de su clausura. Por último, necesitamos el siguiente hecho elemental: 

Teorema 2.57 Sea M un espacio métrico completo. Toda familia decreciente 
{Cn}n de cerrados en M no vacíos tal que límd(C n ) = 0 tiene intersección no 

, n 

vacia. 

Demostración: Para cada n tomamos x n £ C n . Como lím„ d(C n ) = 0, es 
claro que la sucesión (x n ) n es de Cauchy. Su límite x está en cada C n por ser 
éste cerrado y {C„}„ decreciente. ■ 



Teorema 2.58 (Teorema de Baire) En un espacio métrico completo, la in- 
tersección de una familia numerable de abiertos densos es un conjunto denso. 

oo 

Demostración: Sea M un espacio métrico completo y G = f] G n una 

n=l 

intersección numerable de abiertos G n densos en M. Basta probar que G corta 
a toda bola abierta B r (x). Como G\ es denso en M existe x\ £ G\ n B r (x). 
Como G\ n B r {x) es abierto, existe un 7*1 > 0, que podemos tomar menor que 
r/2, tal que B ri (xi) cGiH B r {x). 

Inductivamente podemos construir una sucesión {x n } r 
de puntos de M y una sucesión {r„}„ de números reales 
positivos de modo que 

B rn (x n ) C G n H S rn _ 1 (a; n _ 1 ) (2.2) 

y r n < r/n para todo n. 
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Por el teorema anterior, f] B rn {x n ) ^ 0, luego (2.2) implica que 

n=l 

oo 

GDB r (x)D P|(G n nB rB _ 1 (a: n _i))9É0. 

71=1 

■ 

Sin más que tener en cuenta que el complementario de un conjunto denso es 
un conjunto con interior vacío tenemos una forma equivalente del teorema de 
Baire: 

Teorema 2.59 (Teorema de Baire) En un espacio métrico completo, toda 
unión numerable de cerrados de interior vacío tiene interior vacío. 

Conviene observar que la tesis del teorema de Baire (en cualquiera de sus dos 
formas equivalentes) se cumple también sobre espacios topológicos localmente 
compactos, no necesariamente metrizables. La prueba es, de hecho, más sencilla, 
y se obtiene sustituyendo el teorema 2.57 por el hecho de que la intersección de 
una familia decreciente de compactos no vacíos es no vacía. 

Aunque, según hemos indicado, no necesitaremos el teorema de Baire, vamos 
a tratar de explicar su interés. Para ello necesitamos algunas definiciones: 

Definición 2.60 Sea X un espacio topológico. Un subconjunto A de X es 
diseminado si X \ A contiene un abierto denso o, equivalentemente, si A está 
contenido en un cerrado de interior vacío o, también, si int A = 0. 

Informalmente, la idea es que un abierto denso (y cualquier conjunto que 
lo contenga) es un conjunto "muy grande" desde el punto de vista topológico, 
pues todo abierto contiene un abierto contenido en tal conjunto; los conjuntos 
diseminados son topológicamente "muy pequeños". Como todo conjunto que 
contenga a un conjunto que contenga a un abierto denso contiene un abierto 
denso, tomando complementarios obtenemos que los subconjuntos de los conjun- 
tos diseminados son diseminados. Esta noción de conjunto diseminado resulta 
ser muy restrictiva, esencialmente a causa de que no se conserva por uniones 
numerables, por ello se definen los conjuntos de primera categoría: 

Definición 2.61 Un subconjunto A de un espacio topológico X es de primera 
categoría si es unión numerable de conjuntos diseminados. A es de segunda 
categoría si no es de primera categoría. 

Es evidente que toda unión numerable de conjuntos de primera categoría 
es de primera categoría. Así, los conjuntos de primera categoría son conjun- 
tos topológicamente "pequeños", aunque no necesariamente "muy pequeños", 
mientras que los conjuntos de segunda categoría son los topológicamente "gran- 
des". 

No obstante, estas nociones no sirven de nada sin el teorema de Baire, que 
puede enunciarse en una tercera forma equivalente: 
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Teorema 2.62 (Teorema de Baire) En un espacio métrico completo, los con- 
juntos de primera categoría tienen interior vacio. 

DEMOSTRACIÓN: Consideremos un conjunto C de primera categoría. En- 
tonces 

C = \JA n c \JA n = C, 

n n 

donde los conjuntos A n son diseminados, luego sus clausuras son cerrados de 
interior vacío, luego C tiene interior vacío (por la versión que ya hemos probado 
del teorema de Baire) y C también. ■ 

Así pues, si probamos que un conjunto C es "pequeño" , en el sentido de 
que es de primera categoría, el teorema de Baire nos da que todo abierto va a 
contener puntos que no están en C. Este es esencialmente el interés del teorema 
de Baire. 

Terminaremos con una aplicación del teorema de Baire, que no es de las más 
típicas, pero tal vez la más sencilla: 



Ejemplo Q no puede expresarse como una intersección numerable de abiertos 
de R. 

En efecto, en tal caso sería una intersección numerable de abiertos densos, 
luego R \ Q sería una unión numerable de cerrados de interior vacío, al igual que 
K = Q U (K \ Q). El teorema de Baire nos daría entonces que IR tiene interior 
vacío (en sí mismo), lo cual es absurdo. ■ 

Los conjuntos que pueden expresarse como intersección numerable de abier- 
tos se llaman conjuntos G$. El ejemplo anterior, junto con el teorema siguiente, 
muestra que no puede existir una función / : IR — > IR continua en los puntos 
Q y discontinua en los de IR \ Q. (Si el lector cree que esto es evidente, debería 
pensar en el ejercicio que sigue al teorema.) 

Teorema 2.63 Sea M un espacio métrico completo. El conjunto de puntos de 
continuidad de toda función f : M — > IR es un Gs ■ 

Demostración: Para cada natural no nulo n definimos 

G n = {x e M | existe 8 > 0 tal que sup f(y) — ínf f(y) < l/n}. 

yeB¿(x) yeB 5 (x) 

Claramente los conjuntos G n son abiertos. Basta probar que el conjunto de 

oo 

puntos de continuidad de / es G = f] G n . 

71=1 

Si / es continua en x, dado un n > 0 existe un 8 > 0 tal que si y G B¡{x) 
entonces |/(x) — f(y)\ < l/(4n). Por lo tanto, si y, y' € B§(x) se cumple que 
\f(y) — f(y')\ < l/(2n) y, tomando el supremo en y y el ínfimo en y' , concluimos 
que x G G n . 
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Recíprocamente, supongamos que x € G. Dado e > 0 tomamos n tal que 
1/n < e. Como x G G n , existe 5 > 0 tal que 

SU P f(y) - ínf f(y) < 

seBsW yeB s (x) 
Entonces si y € B¿(x) se tiene que 

\f(x)-f(y)\< sup f(y)- ínf /(y) < 1/n < e, 

luego / es continua en x. m 

Ejercicio: Consideremos la función / : K — > K dada por 

f( x j = / I/? si * = p/q con p, qeZ, (p, g) = 1, g > 0, 
lO en caso contrario. 

Demostrar que lím /(a;) = 0 para todo xq € R. Deducir que / es continua en R \ Q 

y discontinua en Q. 



Capítulo III 

Cálculo diferencial de una 
variable 

En este capítulo estudiaremos una de las ideas más importantes y fructíferas 
que posee la matemática actual. Su núcleo está en la observación de que mu- 
chas curvas se parecen localmente a rectas. Por ejemplo, visto suficientemente 
de cerca, un arco de circunferencia es indistinguible de un segmento de recta. 
Una prueba de ello está en el horizonte que separa el cielo del mar en un día 
despejado. Se trata de un arco de circunferencia, pero ¿se ve que es así? 

La razón por la que el horizonte parece recto no es que la Tierra sea muy 
grande, sino que la vemos muy de cerca. Vista desde la Luna es claramente 
esférica y cualquier circunferencia al microscopio parece una recta. Lo mismo 
sucede con muchas curvas, que si las vemos muy de cerca parecen rectas. Pero 
esto no es cierto para todas. Pensemos en la curva de la figura. 

Vista de cerca podría pasar por una recta en un en- 
torno de cualquiera de sus puntos excepto el señalado 
con el círculo, donde tiene un "pico". Por más que nos 
acerquemos nunca dejaremos de ver ese pico que delatará 
que no se trata de una recta. Vamos a estudiar las curvas que localmente se 
parecen a rectas. Pero ¿qué es exactamente parecerse a una recta? 

3.1 Derivación 

Consideremos una función / definida en un entorno 
de un punto a € R y con imagen en R. Supongamos 
que su gráfica se parece mucho a una recta en un en- 
torno del punto. La pregunta es ¿a qué recta se parece? 
Por lo pronto a una que pasa por el punto (a, /(a)). 
Las rectas que pasan por dicho punto (a excepción de 
la vertical, que no nos va a interesar) son de la forma r(. 
donde m € K. 




r 




a 

') = m(x - a) + f(a), 
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La interpretación geométrica de ra. es sencilla. En general, si tenemos una 
recta r(x) — mx + n, en un punto a tomará el valor r(a) = ma + n. Si nos 
trasladamos a un punto a + h con h ^ 0 obtendremos r(a + h) = ma + mh + n. 
El incremento que ha experimentado la función es r(a + h) — r(a) = mh, y si lo 
dividimos por el desplazamiento h obtenemos, independientemente de cuál sea 
h, el valor m. Es decir, 

r(a + h) — r(a) 

m = i . 

h 

Geométricamente esto no es sino el teorema de Tales. En definitiva, m expresa lo 
que aumenta la función por unidad de avance: si nos desplazamos h = 1 unidad, 
la recta aumenta en ra unidades, si avanzamos h = 2 unidades, la recta aumenta 
2m, etc. Por lo tanto, si el valor de ra es grande la recta subirá muy rápidamente, 
será una recta muy empinada. Si ra = 0 la recta no sube, es constante. Si m 
es negativo la recta baja, más rápidamente cuanto mayor sea ra en módulo. El 
número ra se llama pendiente de la recta. Una recta viene determinada por 
dos de sus puntos o bien por uno de sus puntos y su pendiente (pues conocido 
un punto (a, b) y la pendiente m conocemos más puntos: (a + 1,6 + ra), por 
ejemplo). 

Volviendo a nuestro problema, tenemos la recta r(x) = m(x — a) + f(a), cuya 
pendiente es ra. Nos falta determinar ra para que sea la recta que se parece a /. 
Consideremos la expresión 

m(h) = /(a + / ^- /(a) . (3.1) 

Esto no es una constante (salvo que / sea una recta), pero si ciertamente / 
se parece a una recta r, esta expresión debería parecerse a la pendiente de r. 
Si / se parece más a r cuanto más de cerca la miramos, esto es, cuando consi- 
deramos puntos más cercanos al punto a, el valor m(h) debería parecerse más 
a la pendiente de r cuanto menor es h. Por ello definimos: 

Definición 3.1 Sea / : A — > IR y a un punto interior de A. Diremos que / es 
derivable en a si existe (en IR) 

fia) = Km /(° + 

Cuando esto sucede, a la recta r(x) = f'(a)(x — a) + f(a) se le llama recta 
tangente a / en el punto (a, /(a)) (o para abreviar, en el punto a). El número 
f'(a) es la derivada de / en el punto a. 

Según hemos dicho, una función es derivable en un punto cuando su gráfica 
se confunde en un entorno de dicho punto con la de una recta, la recta tangente 
a la función en el punto. Esto no es exacto, pues en realidad hay funciones 
que se parecen a rectas en los alrededores de un punto y pese a ello no son 
derivables. Esto ocurre cuando la recta tangente es vertical, con lo que su 
pendiente es infinita y no existe (en IR) el límite que define la derivada. Un 
ejemplo lo proporciona la función y/x en x = 0. 



3. 1 . Derivación 
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Observamos que el eje vertical es tangente a la función en 0, pese a lo cual, 
según veremos, la función no es derivable en 0. 

Diremos que una función es derivable en un abierto A si es derivable en 
todos los puntos de A. Una función es derivable si su dominio es un abierto y 
es derivable en todos sus puntos. 

Si / : A — > IR es derivable, tenemos definida otra función /' : A — > R que 
a cada punto o £ i le asigna su derivada f'(a). A esta función la llamamos 
(función) derivada de / en A. 

Teniendo en cuenta la motivación que hemos dado para el concepto de de- 
rivada, es claro que toda recta no vertical, f(x) = mx + n es derivable en R 
y su derivada es su pendiente, o sea, m. La razón es que, según hemos visto, 
el cociente (3.1) es en este caso constante igual a m, luego el límite cuando h 
tiende a 0 es igualmente ra. En particular, la derivada de una función constante, 
f(x) = a, es f(x) = 0. 



Ejemplo Calculemos la derivada de la función f(x) = x 2 . 

,// x i, (x + h) 2 -x 2 „ x 2 + 2xh + h 2 - x 2 „ „ , 

f(x) = Km '- = Km = Km 2x + h = 2x. 

h^a h h^o h h^o 



Enseguida veremos que es muy fácil reconocer las funciones derivables así 
como calcular sus derivadas. Primero demostremos un KecKo básico. Obvia- 
mente, lo primero que Ka de Kacer una función para parecerse a una recta es ser 
continua. 

Teorema 3.2 Si una función es derivable en un punto a, entonces es continua 
en a. 

Demostración: Sea / : A — > R derivable en a. Entonces existe 
fia) = Km ^+ h )-^). 
Como Km h — 0, multiplicando obtenemos que 

Km(/(a + /i)-/(a)) = /'(a)0 = 0. 

h — ^0 
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Por lo tanto lím f(a + h) = /(a). Teniendo en cuenta la definición de límite, 
es fácil ver que esto equivale a que lím f(x) = /(o). Esto significa que / es 

x—>a 

continua en a. ■ 

En particular, las funciones derivables son continuas, pero no toda función 
continua es derivable. 



Ejemplos Ya hemos dicho que \fx no es derivable en 0. Es fácil probarlo. La 
derivada en 0 sería 

1 



lím ^— — - = lím 

h^O h h^O <Vh 2 



+ 00. 



Aquí la razón es que la pendiente de la función se 
vuelve infinita en 0. Otra causa de no derivabilidad (a pe- 
sar de la continuidad) es que la función forme un "pico" . 
Por ejemplo f(x) = \x\ en x = 0. La derivada sería 




hm — , = lim sig n, 

fc->o h h^0 



pero es claro que el límite por la izquierda es —1 y el límite por la derecha es 
+ 1, luego no existe tal límite. ■ 



3.2 Cálculo de derivadas 

El teorema siguiente recoge las propiedades básicas que nos permiten derivar 
las funciones más simples: 

Teorema 3.3 Sean f , g : A — > R funciones derivables en un punto a £ A y 
agí. 

a) f + g es derivable en a y (/ + g)'(a) = f'(a) + g'(a). 

b) af es derivable en a y (af)'(a) = af'(a). 

c) fg es derivable en a y (fg)'(a) = f'(a)g(a) + f(a)g'(a). 

d) Si g(a) ^ 0, f/g es derivable en a y 

lt/g){a)- — ^ 2(a) - . 



En particular, las funciones derivables en A forman una subálgebra de C(A). 



3.2. Cálculo de derivadas 
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Demostración: Las propiedades a) y b) son muy sencillas. Veamos c). 
g(a + h)g(a + h) - f(a)g(a) 



(fg)'(a) = Km 



Km 



fjg + h)g(a + h) - f(a)g(a + h) + f(a)g(a + h) - /(a)g(o) 

/i 



= Km ( /( ° +4^ g(a + h) + /(a) g( " ± h ¡ 9 J& 
= f>{a)g{a) + f{a)gi{a), 



donde Kemos usado la continuidad de g en a al afirmar que Km g(a + h) = g(a). 

h— »0 



La prueba de d) es similar. 



„ra-l 



Aplicando inductivamente la propiedad c) se obtiene que (x™)' = nx" 
para todo natural n > 1. Aplicando abora d) resulta que esto es cierto para 
todo entero n ^ 0. En particular todos los polinomios y fracciones algebraicas 
son derivables en sus dominios. 

Por ejemplo, la derivada de 3a; 4 — 2x 3 +x 2 +5x— 3 es igual a 12x 3 — 6x 2 +2a;+5. 
Observar que la derivada de un polinomio coincide con su derivada formal en el 
sentido algebraico. 

La derivación de las raíces se seguirá un resultado general sobre funciones 
inversas. Por ejemplo, la función ^fx es la inversa de la función x 3 . Esto significa 
que un punto (x, y) está en la gráfica de yfx si y sólo si el punto (y, x) está en 
la de a; 3 . La gráfica de una se obtiene de la de la otra cambiando x por y. 
Geométricamente esto equivale a girar la gráfica respecto a la diagonal: 




Es claro geométricamente que si una función tiene tangente en el punto 
(x, y), su inversa tendrá tangente en el punto (y, x), y que la recta tangente a la 
inversa resultará de girar respecto a la diagonal la recta tangente a la función 
original. AKora bien, ¿qué relación Kay entre la pendiente de una recta y la 
pendiente de la recta que resulta de girarla respecto a la diagonal?. Si una recta 
es y = mx + n (con pendiente m) , girar respecto a la diagonal es cambiar y por 
x, o sea, pasar a x = my + n. Despejando y obtenemos y = (l/m)x — n/m. 
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Por lo tanto la pendiente es 1/m. Si la recta original tiene pendiente 0 (es 
horizontal), la recta girada es vertical, tiene pendiente infinita. 

Por lo tanto es de esperar que si una función biyectiva / cumple /(a) = b y 
tiene derivada m ^ 0 en «, entonces su inversa tiene derivada 1/m en b. Antes 
de probarlo analíticamente damos un sencillo resultado técnico. 

Definición 3.4 Sea A un intervalo y / : A — > R, diremos que / es creciente en 
A si cuando x < y son dos puntos de A, se cumple f(x) < f(y). Si de hecho se 
cumple f(x) < f(y) diremos que / es estrictamente creciente en A. Se dice que 
/ es decreciente en A si cuando x < y son puntos de A, se cumple f(y) < f(x). 
Si se cumple f(y) < f(x) se dice que es estrictamente decreciente en A. La 
función / es (estrictamente) monótona en A si es (estrictamente) creciente o 
decreciente en A. 

Por ejemplo, la función x 3 es estrictamente creciente en R. 

Teorema 3.5 Sea A un intervalo y f : A — > R una función inyectiva y conti- 
nua. Entonces f es estrictamente monótona en A. 

DEMOSTRACIÓN: Sean a < & dos puntos cualesquiera de A. Supongamos que 
f(a) < f(b). Entonces todo a < x < b ha de cumplir f(a) < f(x) < /(&), pues 
si, por ejemplo, f(x) < f(a) < f(b) , por el teorema de los valores intermedios, en 
el intervalo ]x, b[ habría un punto cuya imagen sería /(a), y / no sería inyectiva. 

De aquí se sigue que / es creciente en [a, b), pues si a < x < y < b, hemos 
visto que f(a) < f(x) < /(&), y aplicando lo mismo a los puntos x, b, resulta 
que f(x) < f(y) < f(b). Igualmente, de f(b) < f(a) llegaríamos a que / es 
decreciente en [a,b]. Por lo tanto / es monótona en cualquier intervalo [a,b] 
contenido en A. 

Pero si / no fuera monótona en A existirían puntos u < v y r < s tales 
que f(u) < f(v) y f(s) < f(r). Tomando el mínimo y el máximo de estos 
cuatro puntos obtendríamos los extremos de un intervalo en el que / no sería 
monótona. ■ 

Teorema 3.6 (Teorema de la función inversa) Sea A un intervalo abierto 
y f : A — > R una función inyectiva y derivable en A tal que f no se anule en 
ningún punto de A. Entonces 

a) B = f[A] es un intervalo abierto. 

b) La función inversa g = f : B — > A es derivable en B. 

c) Para todo a G A, si f(a) = b, se cumple que g'(b) = l/f'(a). 

DEMOSTRACIÓN: Por el teorema anterior sabemos que / es estrictamente 
monótona. Digamos que es monótona creciente. Si a < b son dos puntos de 
A, por conexión /[]o, 6[] ha de ser un intervalo, y de la monotonía se sigue 
fácilmente que /[]a,6[] = ]/(a), /(&)[• 
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Dado a G A, podemos tomar un e > 0 tal que [a — e, a + e] C A, con lo que 

/(a) G ]/(a - e), /(a - e)[ = /[]a - e, a + e[] C i?. 

Así pues B es un entorno de /(a) para todo a e A, o sea, para todos los 
puntos de B. Por lo tanto B es abierto. Por conexión es un intervalo. Además 
hemos visto que / envía abiertos básicos ]o, b[ a abiertos básicos, y esto significa 
que g es continua. 

Sea ahora ¡(a) = b. Por la monotonía, si h ^ 0, entonces g(6 + /i) ^ g(b). 
Sea fe = g(b + h) - g(b) ^ 0. Así g(b + h) = k + a, luego b + h = /(fe + a), y 
/i = /(fe + a) — /(a). Por lo tanto 

g(b + h)-g(b)_ 1 



/j /(q+fc)-/(q) 
fe 

Ahora, fe es una función de h y, como g es continua, lím k(h) = 0. La 

fc— >o 

derivabilidad de / en el punto a nos da que 



,, h , v g(b + h)-g(b) 1 

g (b) = lim = -jrr-r- 

íwo /i f'(a) 



Ejemplo Sea n un número natural no nulo y consideremos f(x) = x n definida 
en ]0, +oo[. Sabemos que es inyectiva y derivable. Su derivada es ra™ -1 , que 
no se anula en ]0, +oo[. Por lo tanto su inversa, que es g(x) = y/x, es derivable 
en su dominio y si y n = x (con lo que y = \/x), entonces g'(x) = 1/ f'(y), o sea, 

(tfí)' = = ± . = -x- 1+1 ' n . 

ny n ~ L ntyx n 1 n 

Así pues, tenemos probado que la regla de derivación x r rx r_1 es válida 
cuando r es entero o de la forma 1/n, donde n es un número natural no nulo. 
Aplicando la regla del producto se concluye por inducción que vale de hecho 
para todo número racional r. ■ 

Con todo lo anterior, todavía no sabemos derivar funciones como Vx 2 + 1. 
Con el teorema siguiente estaremos en condiciones de derivar cualquiera de las 
funciones que podemos construir a partir de polinomios y raíces. 

Teorema 3.7 (regla de la cadena) Sean f : A — > R y g : B — > IR. Sea un 

punto a € A tal que f sea derivable en a y g sea derivable en f(a). Entonces la 
función compuesta f o g es derivable en a y (/ o g)'(a) = g'(f(á))f'(a). 

Demostración: Notemos que B es un entorno de f(a) y / es continua en 
a, luego / -1 [-B] es un entorno de a sobre el que está definida / o g. 
Sea b = f(a). Para k ^ 0, llamemos 

G(k)= 9{b + k) - 9{b) -g'(b). 
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La función G está definida para los puntos k tales que b + k G B. Como B 
es abierto, G está definida al menos para h en un intervalo ]— e, e[ \ {0}. Como 
g es derivable en 6, existe Km G(k) = 0, luego si definimos G(0) = 0 tenemos 

que G es continua en un entorno de 0. Claramente además 

g(b + k)-g(b) = (g'(b) + G(k))k. 

Ahora tomamos h ^ 0 tal que a+heAyk = f(a + h) — /(a), con lo que 
se cumple /(a + h) = b + k, luego b + k € B y está definido G(k). Entonces 

g (f(a+h))-g{f(a)) = ( g '{f{a)) + G{k))k 

= (g'(f( a ))+G(k))(f(a+h)-f(a)). 

En consecuencia 

(/ ° g)(a + /t / |' (/0g)(a) = (Aña)) + G(f(a+h) - ña))) ña + h l ña) - 

Usando la continuidad de / en a y la de G en 0, tomamos el límite cuando 
h tiende a 0 y queda que existe (/ o g)'(a) — g'(f(a))f'(a)- ■ 

Ejemplo La función h(x) — \J x" 1 + 1 es derivable en IR, pues es la composición 
del polinomio f(x) = x 2 + 1 con la función g(x) = y/x, y ambas funciones son 
derivables en sus dominios. Sabemos que f'(x) — 2x y g'(x) — l/(2y / a;). La 
regla de la cadena nos da que 

hf(x) = g\x 2 + l)f(x) = = -4=. 

2va; + 1 yr + 1 

■ 

El lector que no esté familiarizado con el cálculo de derivadas debería prac- 
ticar hasta que la derivación le resultara un acto mecánico. Hay muchos libros 
adecuados para ello, por lo que en adelante dejaremos de justificar los cálculos 
de derivadas. 



3.3 Propiedades de las funciones derivables 

La derivada de una función contiene mucha información sobre ésta. Consi- 
deremos por ejemplo 

La figura de la página siguiente muestra las gráficas. Fijémonos en el signo 
de la derivada. Es fácil ver que /' tiene una raíz doble en 0 y dos raíces sim- 
ples en ±\/3. La restricción de /' a cada uno de los intervalos ]— oo, — 
] — \/3, 0[, ]0, \/3[ y ] V3, +oo[ es una función continua que no se anula, luego 
por el teorema de los valores intermedios /' tiene signo constante en cada uno 
de ellos. Es fácil ver entonces que el signo de /' varía como indica la gráfica, es 
decir, /' es positiva en los dos intervalos no acotados y negativa en los acotados. 
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En los puntos donde /' es positiva la tangente a / tiene pendiente positiva, 
y vemos en la gráfica que esto se traduce en que / es creciente. Por el contrario, 
en los intervalos donde /' es negativa la función / es decreciente. 

En los puntos donde /' se anula la tangente a / es horizontal. En —y/3, la 
derivada pasa de ser positiva a ser negativa, luego / pasa de ser creciente a ser 
decreciente, y por ello el punto es un máximo relativo, en el sentido de que / 
toma en —y/3 un valor mayor que en los puntos de alrededor. En cambio, en 
y/3 la derivada pasa de negativa a positiva, / pasa de decreciente a creciente y 
el punto es un mínimo relativo. El caso del 0 es distinto, pues /' es negativa a 
la izquierda, toca el 0 y vuelve a bajar, con lo que sigue siendo negativa. Por 
ello / es creciente en 0 y no tiene ni un máximo ni un mínimo en 0. 

Vemos así que conociendo la derivada podemos formarnos una idea de la 
función: dónde crece, dónde decrece, dónde tiene máximos y mínimos, y más 
cosas de las que no hemos hablado. Vamos a desarrollar todas estas ideas. 

Definición 3.8 Sea f : A CM. — > R. Diremos que / tiene un máximo relativo 
en un punto a € A si existe un entorno V de a contenido en A de modo que para 
todo x € V se cumple f(x) < f(a). Diremos que / tiene un mínimo relativo en 
a si existe un entorno y de a contenido en A tal que para todo x eV se cumple 
/(a) < f( x )- La función / tiene un extremo relativo en a si tiene un máximo o 
un mínimo relativo en a. 

Teorema 3.9 Si f : A — > R es una función derivable en un punto a € A y f 
tiene un extremo relativo en a, entonces f'(a) = 0. 

DEMOSTRACIÓN: Supongamos, por reducción al absurdo, que f'(a) > 0. 
(El caso f'(a) < 0 se razona análogamente.) Entonces ]0, +oo[ es un entorno de 
/'(a), luego por definición de límite y de derivada existe un e > 0 de manera 
que ]a — e, a + e[ C A y si 0 < \h\ < e entonces 

f(a+h)-f(a) > Q 
h 
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Esto se traduce en que f(a + h) > /(a) si h > 0 y /(a + h) < /(a) si h < 0, 
lo que contradice que / tenga un extremo relativo en a. ■ 

La función del ejemplo anterior muestra que /'(a) = 0 no implica que a 
sea un extremo relativo. Más adelante volveremos sobre este punto. Ahora 
probemos una consecuencia sencilla de este teorema: 

Teorema 3.10 (Teorema de Rolle) Sea f : [a, b] — > R una función conti- 
nua en [a,b] y derivable en ]a,b[. Si f(a) = f(b), entonces existe un c £ ]a,b[ 
tal que /' (c) = 0. 

DEMOSTRACIÓN: Como [a, b] es compacto, la función / alcanza un valor 
mínimo rayim valor máximo M. Si se cumpliera que m — M = ¡(a) = f(b), 
entonces / sería constante y su derivada sería nula, luego cualquier c £ ]a,b[ 
cumpliría el teorema. 

Supongamos que m < M. Entonces, o bien m ^ f(a) o bien M ^ /(a). 
Digamos por ejemplo M ^ /(a). Sea c £ [a, b] el punto donde /(c) = M. Como 
M f(a) = f(b), ha de ser a < b < c, y como / toma en c su valor máximo, en 
particular c es un máximo relativo de /, luego por el teorema anterior f'(c) = 0. 

■ 

Como aplicación podemos relacionar la derivabilidad y el crecimiento global 
de una función. 

Teorema 3.11 Sea A un intervalo abierto y f : A — > E una función derivable 
en A tal que f no se anule. Entonces f es estrictamente monótona en A y 
además se da uno de estos dos casos: 

a) o bien f'(x) > 0 para todo x £ A, y entonces f es estrictamente creciente 
en A, 

b) o bien f'(x) < 0 para todo x £ A, y entonces f es monótona decreciente 
en A. 

DEMOSTRACIÓN: En primer lugar, / es inyectiva, pues si a < b son dos 
puntos de A tales que f(a) = f(b), entonces existe un c £ ]a,b[ C A tal que 
f'(c) = 0, en contra de la hipótesis. 

Por el teorema 3.5, / es estrictamente monótona en A. Si es monótona decre- 
ciente, la prueba del teorema 3.9 muestra que no puede ser f'(a) > 0 en ningún 
punto a £ A, luego ha de ser f'(a) < 0 en todos los puntos. Análogamente, si 
/ es monótona creciente ha de ser f'(a) > 0 en toco a £ A. m 

Veamos ahora un resultado técnico: 

Teorema 3.12 (Teorema de Cauchy) Sean f, g : [a,b] — > IR funciones 
continuas en [a, b] y derivables en ]a, b[. Entonces existe un c £ ]a, b[ tal que 



g'(c){f(b)-f(a))=f(c)(g(b)-g(a)). 
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DEMOSTRACIÓN: Consideremos la función dada por 

h(x) = f(x) (g(b) - g(a)) - g(x) (/(&) - /(o)) . 

Se cumple que h(a) = h(b) = f(a)g(b) — g(a)f(b). Además h es continua en 
[a, b] y derivable en ]a, b[. Por el teorema de Rolle existe un punto c e ]a, b[ tal 
que h'(c) = 0, pero h'(x) = f{x)(g{b) - g{d)) - g'(x)(f(b) - /(a)), luego 

f'(c){g(b)-g(a))-g'(c){f(b)-f(a))=0 

m 

Más adelante tendremos ocasión de usar este resultado en toda su genera- 
lidad, pero de momento nos basta con el caso particular que resulta de tomar 
como función g la dada por g(x) = x. Entonces tenemos: 

Teorema 3.13 (Teorema del valor medio) Sea f : [a,b] — > IR una función 
continua en [a, b] y derivable en ]a, b[. Entonces existe un c € ]a, b[ tal que 

f(b)-f(a) = f(c)(b-a). 

Notar que el teorema de Rolle es un caso particular del teorema del valor 
medio. Este teorema tiene una interpretación geométrica. La expresión 

ñb)-f(a) 
b — a 

puede interpretarse como la "pendiente media" de / en [a, b], es decir, es el 
cociente de lo que aumenta / cuando la variable x pasa de a a b dividido entre 
lo que ha aumentado la variable. Lo que dice el teorema del valor medio es 
que hay un punto en el intervalo donde la función toma el valor medio de su 
pendiente. 

La importancia de este teorema es que nos relaciona una magnitud global, 
la pendiente media, con una magnitud local, la derivada en un punto. Las 
consecuencias son muchas. Una aplicación típica es el siguiente refinamiento del 
teorema 3.11: 

Teorema 3.14 Si f : [a, b] — > R es continua en [a,b], derivable en ]a,b[ y su 
derivada es positiva (negativa) en ]a,b[, entonces f es estrictamente creciente 
(decreciente) en [a,b]. 

DEMOSTRACIÓN: El teorema 3.11 nos da que / es estrictamente monótona 
en ]o, b[. Sólo falta probar que es creciente o decreciente en a y en b. 

Si x G ]a,b[, entonces f(x) — /(a) = f'(c)(x — a), para cierto punto c € ]a,x[. 
Por lo tanto, si /' es positiva, f(x) — f(a) > 0 para todo x £ ]a, b[, e igualmente 
se prueba que f(b) — f(x) > 0 para todo x G ]a, b[, luego / es creciente en [a, b}. 



112 



Capítulo 3. Cálculo diferencial de una variable 



Sabemos que las funciones constantes tienen derivada nula. El teorema del 
valor medio nos da el recíproco: 

Teorema 3.15 Si una función tiene derivada nula en todos los puntos de un 
intervalo abierto, entonces es constante. 

Demostración: Sea / una función derivable en un intervalo A con derivada 
nula. Sean a < b dos puntos cualesquiera de A. Entonces f(b) — f(a) = 
f'(c)(b — a) = 0, donde c es un punto de ]o, b[. Por lo tanto / es constante. ■ 

Una consecuencia inmediata es el teorema siguiente, que afirma que una 
función derivable está unívocamente determinada por su derivada y su valor en 
un punto cualquiera. 

Teorema 3.16 Si f y g son funciones derivables en un intervalo abierto y 
f = g' , entonces existe un k € M tal que f = g + k. 

Demostración: La función f — g tiene derivada nula, luego / — g = k. 



Las derivadas proporcionan un teorema muy útil para el cálculo de límites. 
De momento no podemos estimar su valor porque los límites de las funciones 
que conocemos (polinomios, fracciones algebraicas, etc.) son fáciles de calcular 
directamente, pero más adelante tendremos ocasión de aprovecharlo. 

Teorema 3.17 (Regla de L'Hópital) Sean f, g : ]a,b[ — > R funciones de- 
rivables tales que lím f(x) = lím g(x) = 0 y de modo que g y g' no se anulen 

x—>a x—>a 

en ]a, b[. Si existe 

x->a g'{x) 



entonces también existe 



lím 44 = L. 

x^a g(x) 



DEMOSTRACIÓN: Extendamos / y g al intervalo [a,b[ estableciendo que 
f(a) = g(a) = 0. Así siguen siendo continuas. 

Si a < x < b, por el teorema de Cauchy existe un punto c £ ]a, x[ tal que 

{f(x)-f(a))g'(c)=(g(x)-g(a))f'(c), 

o sea, f(x)g'(c) = g(x)f'(c), y como g(x) ^ 0 ^ g'(c), podemos escribir 

m f( C ) 



g{x) g'(c) ' 



(3.2) 



Por definición de límite, si e > 0, existe un S > 0 tal que si 0 < c — a < 5, 
entonces 

f(c) 



9'(c) L 



< e. (3.3) 
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Así tenemos que si 0 < x — a < S, existe un c e ]a, x[ que cumple (3.2) y 
(3.3). Por consiguiente, para todo x € ]a, a + S[ se cumple 



Esto significa que 



- L 



lím 



a g(x) 



< e. 



L. 



Obviamente la regla de L'Hópital también es válida cuando en las hipótesis 
cambiamos a por b. Combinando las dos versiones obtenemos la regla de 
L'Hópital para funciones definidas en intervalos ]a — e, a + e[ \ {a} y tomando 
límites en a (si existe el límite del cociente de derivadas, existen los límites por 
la derecha y por la izquierda y coinciden, por los casos correspondientes de la 
regla, existen los límites de los cocientes de las funciones por ambos lados y 
coinciden, luego existe el límite y coincide con el de las derivadas). 

Los teoremas siguientes demuestran otras variantes de la regla de L'Hópital 
de no menor interés. 



Teorema 3.18 (Regla de L'Hópital) Sean f, g 
nes derívables tales que lím / 

se anulan en ]a, +oo[. Si existe 



+oo[ — > IR dos funcio- 
nes derívables tales que lím f(x) = lím g(x) — 0 y de modo que g y g' no 



entonces también existe 



x^+oo g'(x) 



lím 

rr^+oo g[x) 



L. 



DEMOSTRACIÓN: Consideremos las funciones F(x) = f(í/x) y G{x) = 
g(l/x), definidas en ]0, l/a[. Claramente F y G son continuas, y lím F(x) = 

x— *0 

lím G(x) — 0. Además por la regla de la cadena son funciones derivables y sus 

x— >0 

derivadas son 

x ¿ x ¿ 
También es claro que ni G ni G' se anulan en su dominio y 

F'(x) f'(l/x) 



luego existe 



G'(x) g'(l/x) 
F'(x) 



lím 



o G'(x) 



L, 



114 



Capítulo 3. Cálculo diferencial de una variable 



El caso ya probado de la regla de L'Hópital nos da ahora que también existe 



Obviamente entonces 



hm — -- = L. 

x^o G(x) 



lím m = L. 



x^+oo g(x) 



Igualmente se prueba la regla de L'Hópital para funciones definidas en in- 
tervalos ]— nfty, b[ y cuando x tiende a — oo. 

Así pues, si tenemos una indeterminación de tipo 0/0 y al derivar nume- 
rador y denominador podemos calcular el límite, la función original tiene ese 
mismo límite. Ahora veremos que la regla de L'Hópital es aplicable también a 
indeterminaciones del tipo oo/oo. 



Teorema 3.19 (Regla de L'Hópital) Sean f, g : ]a, +oo[ — > IR dos funcio- 

lím g(x) = oo y de modo que g y g' no 

x— >+oo 



nes derivables tales que lím f(x) 
se anulan en ]a, +oo[. Si existe 



lím 



entonces también existe 



x^-+oo g'(x) 
x->+oo g(x) 



L. 



DEMOSTRACIÓN: Por definición de límite, dado e > 0, existe un M > a tal 
que si x > M entonces 



9'{x) 



-L 



< e. 



Por el teorema de Cauchy, si x > M, existe un y € ]M, x[ de modo que 

f(x) - f(M) _ f(y) 



luego 



g(x) - g(M) g'(y) 
f(x) - f(M) 



< e. 



g(x) - g{M) 

(Notar que, como g' no se anula, la función g es monótona, luego el denominador 
es no nulo). 

Puesto que lím f(x) = oo, existe un N > M tal que si x > N entonces 

x^+oo 

\f(x)\ > |/(M)|, y en particular f(x) - f(M) ± 0. Por ello, para x > N 
podemos escribir 

f(x) = f(x) - f(M) f(x) g(x) - g{M) 
g(x) g(x) - g(M) f(x) - f(M) g(x) ' 
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Si en los dos últimos factores dividimos numerador y denominador entre /(x) 
y g(x) respectivamente, queda claro que tienden a 1 cuando x — > +oo, luego 
tomando N suficientemente grande podemos suponer que si x > N entonces el 
producto de ambos dista de 1 menos de e. De este modo, para x suficientemente 
grande, el cociente f(x) /g(x) se puede expresar como producto de dos números 
reales, uno arbitrariamente próximo a L y otro arbitrariamente próximo a 1. 
De la continuidad del producto se sigue que 

lím 44 =L. 

x^+co g(x) 



Naturalmente la regla de L'Hópital también es válida en el caso oo/oo cuando 
x — > — oo. El mismo argumento que nos ha permitido pasar del caso finito al 
caso infinito en la indeterminación 0/0 nos permite pasar ahora al caso finito. 
Es fácil probar: 

Teorema 3.20 (Regla de L'Hópital) Sean f, g : ]a, b[ — > IR derívables tales 
que lím f(x) — lím g(x) = oo y de modo que g y g' no se anulan en la, b[. Si 

x^a ' x— a 

existe 

x^a g'{x) 



entonces también existe 



lím ^ = L. 



También se cumple la versión correspondiente cuando x tiende a b y cuando 
x tiende a un punto por la izquierda y la derecha a la vez. 



3.4 La diferencial de una función 

Consideremos una función / : A — > IR derivable en un punto a € A. Sea 
Ax un número próximo a 0 de modo que a + Ax € A (el término Ax se lee 
"incremento de x", porque representa un pequeño aumento de la variable x 
en el punto a) . Al calcular / en el punto a + Ax obtenemos una variación o 
incremento de / dado por A a (f) = f(a + Ax) — /(a). La expresión A a (f) 
representa a una función de la variable Ax, definida en un entorno de 0. La 
derivada de / en a es, por definición, 

/ (a) = hm — . 

Llamemos 

e a (Ax) = ^£±-f(a). 

Así, lím e a (Ax) = 0. 

Ax— o 
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Desarrollando las definiciones tenemos que 



A a (/) = f(a + Ax) - f(a) = f'(a)Ax + e(Ax)Ax. 



La figura muestra la situación: 



f(a)Ax 





e a (Ax)Ax 



A a (f) 



Ax 



a 



a + Ax 



El hecho de que e a (Ax) tienda a 0 expresa simplemente el hecho de que, 
para valores pequeños de Ax, se cumple f(a + Ax) — f(a) sa f'(a)Ax, donde el 
signo w significa "aproximadamente igual" , es decir, que el valor de la función 
f(a + Ax) es similar al de la recta tangente f(a) + f'(a)Ax. En la figura ambos 
valores son muy diferentes porque hemos tomado un Ax grande para mayor 
claridad. 

Llamaremos diferencial de / en el punto a a la aplicación df(a) : IR — > R 
dada por df(a)(Ax) = f'(a)Ax. Así df(a) es una aplicación lineal en R de 
modo que f(a + Ax) — f(a) « df(a)(Ax), o sea, la función df(a) aproxima las 
diferencias entre las imágenes de / en puntos cercanos al punto a y la imagen 
de a. De aquí su nombre. 

Si consideramos la función polinómica x, su derivada es 1, luego la diferencial 
de x es simplemente dx(a)(Ax) = Ax. Por ello podemos escribir df(a)(Ax) = 
f'(a) dx(a)(Ax), luego tenemos la igualdad funcional 



Si la función / es derivable en todo punto de A, la igualdad anterior se cumple 
en todo punto, luego si consideramos a df y dx como aplicaciones de A en el 
espacio de aplicaciones lineales de R en R, tenemos la igualdad funcional 



donde dx es la función constante que a cada a € A le asigna la función identidad 



Del mismo modo que la estructura topológica permite hablar de los puntos 
de alrededor de un punto dado, pese a que ningún punto en particular está 
alrededor de otro, así mismo la diferencial de una función recoge el concepto 
de "incremento infinitesimal" de una función, pese a que ningiin incremento 
en particular es infinitamente pequeño. Por ejemplo, la igualdad dx 2 = 2xdx 



df(a) = f(a)dx(a). 



df = fdx, 



en R. 
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expresa que cuando la variable x experimenta un incremento infinitesimal dx, 
la función x 2 experimenta un incremento infinitesimal de 2xdx. Con rigor, dx 2 
no es un incremento infinitesimal, sino la función que a cada incremento Ax 
le asigna una aproximación al incremento correspondiente de x 2 , de modo que 
lo que propiamente tenemos es la aproximación que resulta de evaluar dx en 
incrementos concretos, es decir, A x (x 2 ) ss 2xAx. El error de esta aproximación 
se puede hacer arbitrariamente pequeño tomando Aa; suficientemente pequeño. 

Por ejemplo, (1,1) 2 sa l 2 + dx 2 (l)(0,l) = 1 + 2-0,1 = 1,2. En realidad 
(1,1) 2 = 1,21, luego el error cometido es de una centésima. 

Dada la igualdad df = f dx, representaremos también la derivada de / 
mediante la notación 

™-& 

que expresa que f'(x) es la proporción entre las funciones df y dx, o también que 
f'(x) es la razón entre un incremento infinitesimal de / respecto al incremento 
infinitesimal de x que lo ocasiona. 

Es costumbre, especialmente en física, nombrar las funciones, no por la ex- 
presión que las determina, sino por la magnitud que determinan. Por ejemplo, 
supongamos que la posición e de un objeto depende del tiempo viene dada por 
la relación e(t) = t 2 Entonces la velocidad del móvil es 

de 

v(t) = Tt =2t, 

lo que nos permite expresar t en función de v, mediante t(v) = v/2. A su vez, 
esto nos permite calcular la posición en función de la velocidad, mediante la 
función e(v) = v 2 /4. 

De este modo, llamamos e tanto a la función e(t) como a la función e(i>), 
que son funciones distintas. La letra v representa a una función en v = 2t y a 
una variable en t — v/2. Estos convenios no provocan ninguna ambigüedad, al 
contrario, en muchos casos resultan más claros y permiten expresar los resul- 
tados de forma mas elegante. Por ejemplo, si tenemos dos funciones y = y(x) 
y z = z(y), entonces la función compuesta se expresa, en estos términos, como 
z = z(x). Si las funciones son derivables en sus dominios, la regla de la cadena 
se convierte en 

dz dz dy 
dx dy dx 

La primera derivada es la de la función compuesta z(x), mientras que la 
segunda es la de z (y) . No es necesario indicar que dicha derivada ha de calcularse 
en y(x), pues esto ya está implícito en el hecho de que se trata de una función 
de y (no de x). Por ejemplo, 

de de dv v 

-r = -r-r = ^- ^ = v = 2t, 

dt dv dt 2 

como cabía esperar. 
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Similarmente, si y{x) es una función inyectiva y derivable con derivada no 
nula, su inversa se representa por x(y), y el teorema de la función inversa se 
expresa así: 

dy_ = l_ 

dx d f- 
dy 



Por ejemplo, 

dv _ 1 1 



= 2. 



Vemos, pues, que en estos términos las propiedades de las derivadas son 
formalmente análogas a las de las fracciones. 



3.5 El teorema de Taylor 

Sea / : A — > IR una función derivable en el abierto A y tal que /' : A — > IR 
también sea derivable en A. Entonces a la derivada de /' se la denomina derivada 
segunda de / en A, y se representa por /". 

A su vez la derivada segunda puede ser derivable, y entonces está definida la 
derivada tercera, y así sucesivamente. Si una función admite n derivadas en A, 
a la derivada n-sima se la representa por : A — > IR. 

Conviene usar la notación /°) para referirse a la propia función /. 

Llamaremos C n (A) al conjunto de las funciones definidas en A que admiten n 
derivadas y todas ellas son continuas en A. Si llamamos C°(A) — C(A), es decir, 
al conjunto de las funciones continuas en A, entonces tenemos 

C°(A) D C X {A) D C 2 (A) D C 3 (A) D C 4 (A) D ■ ■ ■ 

Llamaremos C°°(Á) al conjunto de las funciones infinitamente derivables 
en A. Por ejemplo, los polinomios y las fracciones algebraicas son de clase C°° 
en su dominio. Es inmediato que estos conjuntos son todos subálgebras de C(A). 

Las inclusiones son todas estrictas. Por ejemplo, si a € A es fácil ver que la 
función dada por 

, . _ J (x — a) n+1 si x > a 
■ nX > ~ { -(x-a) n+1 six<a 

es una función de clase C n (Á) pero no de clase C n+1 (A). 

Según sabemos, si una función / es derivable en un punto a, entonces alre- 
dedor de a la función / puede ser aproximada por su recta tangente, esto es, 
por el polinomio /(a) + f'(a)(x — a). La recta tangente es el único polinomio 
P{x) de grado 1 que cumple P(a) = f(a) y P'(a) = f'(a). 

Cabe suponer que si una función / admite dos derivadas y tomamos un 
polinomio P de grado 2 tal que P(o) = /(a), P'(a) = /'(a) y P"(a) = /"(a), 
el polinomio P nos dará una aproximación mejor de la función / que la recta 
tangente. Esto no siempre es así, pero hay bastante de verdad en ello. Vamos 
a investigarlo. 



3.5. El teorema de Taylor 
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Ante todo, si K es un cuerpo y a € K, la aplicación u : K[x] — > dada 
por = p(a; — a) es un isomorfismo de ií-espacios vectoriales. Como los 
polinomios 1, x, x 2 , x 3 , . . . son una fí-base de K[x], resulta que los polinomios 

1, (x — a), (x — a) 2 , {x — a) 3 , (x — a) 4 ,... 

son también una if-base, es decir, que todo polinomio de K[x] se expresa de 
forma única como 

P(x) = c 0 + a(x -a) + c 2 (x — a) 2 H h c„(x - a)™, (3.4) 

para cierto natural n y ciertos coeficientes c Q , . . . , c„ G if. 

Si una función / admite n derivadas en un punto a, las ecuaciones 

f(a) = P(a), f'(a)=P'(a), ... f n \a) = P n \a) 

son satisfechas por un único polinomio de grado < n. En efecto, si P(x) viene 
dado por (3.4), entonces P(a) = c 0 , luego ha de ser co = f(a). Derivando 
obtenemos 

P'(x) = ci + 2c 2 (x — o) H h nc„(x - a)™ -1 , 

de donde P'(a) = c 1; y ha de ser C\ = f'(a). Similarmente, P"(a) = 2c 2 , luego 
c 2 = f"(a)/2. Igualmente se obtiene C3 = f"'(a)/6 y, en general, Cfe = f k \a)/k\. 
En resumen: 

fe=0 

Recíprocamente, es fácil ver que el polinomio P(x) así definido cumple que 
P k) (a) = f k) (a) para fe = 0, . . . , n. 



Definición 3.21 Sea / una función derivable n veces en un punto a. Llamare- 
mos polinomio de Taylor de grado n de / en a al polinomio 

p n (f)(x) = 4r( x - a ) k e R N- 

fc=o K - 

El polinomio de Taylor es el único polinomio P de grado menor o igual 
que n que cumple P k \a) = f k \a) para k — 0, . . . , n. En particular si / es un 
polinomio de grado menor o igual que n se ha de cumplir P n (f) = f ■ 

Notar también que Po(f) = f(a), y que P\(f) = f(a) + f'(a)(x — a) es la 
recta tangente a / en a. Nuestra conjetura es que P n (f) es el polinomio de 
grado menor o igual que n que más se parece a / alrededor de a. 
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Ejemplo Consideremos la función f(x) 
derivadas: 



5 1 / 2 y a = 1. Calculemos sus 



Orde 



Derivada 



en 1 



x 



TJT 
-1/2 



1 l T -3/2 

2 2 X 



113, 
2 2 2" 

113 5, 
2 2 2 2- 



-5/2 
-7/2 



1 
2 

_1 1 
2 2 

113 
2 2 2 

113 5 
2 2 2 2 



En general se prueba que las derivadas en 1 van alternando el signo, en el 
numerador tienen el producto de los primeros impares y en el denominador las 
sucesivas potencias de 2. Con esto podemos calcular cualquier polinomio de 
Taylor en 1: 



W)(z) 



l+gOc-l), 

l + \{x-l)-\(x-l)\ 

l+\{x-l)-\{x-lf + ^{x-l)\ 



Aquí están sus gráficas junto a la de la función. Vemos que el intervalo en 
que se confunden con la gráfica de / es cada vez mayor. 




1.75 
1.5 
1.25 



1.75 
1.5 
1.25 



0.75 
0.5 
0.25 ' 



0.75 
0.5 
0.25 v 



El polinomio de grado 8 es bastante representativo de lo que sucede cuando 
n es grande: 
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Vemos que la aproximación es cada vez mejor en el intervalo [0,2], pero a 
partir del 2 el polinomio se aleja bruscamente. Un ejemplo numérico: 

P 8 (/)(l,5) = 1,224729895, mientras que y/l^> = 1,224744871... 

La aproximación tiene 5 cifras exactas. ■ 

Los polinomios de Taylor plantean varios problemas importantes. La cues- 
tión principal es si el error producido al aproximar una función de clase C°° por 
sus polinomios de Taylor puede reducirse arbitrariamente aumentando suficien- 
temente el grado. 



Definición 3.22 Si / es una función de clase C°° en un entorno de un punto 
o, llamaremos serie de Taylor de / en a a la serie funcional 

fc=0 

La cuestión es si la serie de Taylor de / converge a /. El ejemplo anterior 
sugiere que la serie de y/x en 1 converge a la función en el intervalo ]0, 2[, pero no 
parece converger más allá de 2. También hemos de tener presente la posibilidad 
de que la serie de Taylor de una función / converja a una función distinta de /. 
Para estudiar estos problemas introducimos el concepto de resto de Taylor: 

Sea / una función derivable n veces en un punto a. Llamaremos resto de 
Taylor de grado n de / en a, a la función R n (f)(x) = f(x) — P n (f)(x), donde 
Pn(f) es el polinomio de Taylor de grado n de / en a. 

Nuestro problema es determinar el comportamiento del resto de una función. 
Para ello contamos con el siguiente teorema, que es una generalización del teo- 
rema del valor medio. 



Teorema 3.23 (Teorema de Taylor) Sea f : A — > IR una función derivable 
n+í veces en un intervalo abierto A y a £ A. Entonces para cada x € A existe 
un A € ]0, 1[ tal que si c = Xa + (1 — X)x, se cumple 

fn+l)( c \ 

^(/)(-) = fc T w(--«r +1 - 
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Demostración: Para x = a es evidente, pues se cumple P n (f)(a) = f(a) 
y R n (f)(x) = 0. Supongamos que x ^ a. Sea 

Q(x) = {x _ l a)n+1 R n {f){*)- 

Sea F : A — > R dada por 
F(t) = /W-(/(¿)+^/'(í)+^fW + -+ ( ^f ) (í) 

+( X -t) n+i Q(x)y 

La función / y sus n primeras derivadas son continuas y derivables, luego F 
también es continua y derivable en A. Además F{x) = f(x) — f(x) = 0 y 

F(a) = f(a) - (P„(/)(o) + (x- a) n+1 Q(x)) = R n {f){x) - R n {f){x) = 0. 

Por el teorema de Rolle existe un punto entre a y a;, o sea, de la forma 
c = Xa + (1 — X)x, tal que F'(c) — 0. Calculemos en general F'(t): 

F'(t) = 0 - (/'(i) - f'(t) + X -^f"{t) fc^/"(í) + ^V'(Í) 
_ n( a! -t)"- 1 r)(t) + (x_íT /n+ i )(í) _ (n + l){x t)nQ[x) ^ 

Los términos consecutivos se cancelan entre sí, y queda 

F'(t) = _í^_^ r +i) (í ) + („ + i)^ _ t) n Q(x). 
Como F'(c) — 0, evaluando en c queda 

y por definición de Q: 

fn+l)( c \ 

iU/)(*) = ^^(*-«r +1 . 

■ 

Así pues, la diferencia entre P n (f)(x) y /(x) tiene la forma de un monomio 
más del polinomio de Taylor salvo por el hecho de que la derivada (n+ l)-ésima 
no se evalúa en el punto a, sino en un punto intermedio entre a y x. 

Por ejemplo, si las derivadas de / están uniformemente acotadas en un in- 
tervalo A, es decir, si existe una misma constante K tal que |/")(ar)| < K para 
todo natural n y para todo x € A, entonces 



\f(x)-P n (f)(x)\ = 



(n + l) 



ií|x-a| n+1 
" (n + l)! 



En el ejemplo de la página 56 probamos que la sucesión M n /n\ converge a 0, 
luego la sucesión {P n (f)(x)}^L 0 tiende a f(x). Así pues: 



3.6. Seríes de potencias 
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Teorema 3.24 Si A es un intervalo abierto, a € A, f g C°°(A) y las derivadas 
de f están uniformemente acotadas en A, entonces para cada punto x € A se 
cumple 

/(*) = E^(*-ar. 

n=0 

Este teorema no es aplicable a y/x. En muchos casos, entre ellos el de 
esta función, los problemas de convergencia de las series de Taylor se vuelven 
evidentes en el contexto de la teoría de funciones de variable compleja (ver el 
capítulo XII). Los resultados de la sección siguiente resultan de gran ayuda en 
muchos casos, como tendremos ocasión de comprobar más adelante. 



3.6 Series de potencias 

Definición 3.25 Sea a € C y {a„}^L 0 una sucesión en C. La serie de potencias 
de coeficientes {a n }^ =0 y centro a es la serie funcional 

oo 

^a n {z-a) n . 

Las series de Taylor son, pues, series de potencias. En muchos casos es 
fácil determinar en qué puntos converge una serie de potencias. Para verlo 
necesitamos el concepto de límite superior de una sucesión de números reales. 
Se trata de lo siguiente: 

Sea {a n }^ =0 una sucesión de números reales. Su límite superiores el supremo 
(en R) del conjunto de sus puntos adherentes. Lo representaremos mediante 
líma„. 

n 

Se cumple que 

líma n = ínf supa„. 

n k>0n>k 

En efecto, sea p un punto adherente de 0 . Dados e > 0 y k > 0, existe 

un n > k tal que a n € ]p — e,p + e[, luego p — e < sup a n . Esto vale para todo 

n>k 

e > 0, luego p < sup a n para todo k > 0, luego p < ínf sup a n . Como el límite 

n>k k>0n>k 

superior es el supremo de estos p, tenemos que líma n < ínf sup a n . 

n k>0n>k 

Sea L = ínf sup a n . Dado e > 0, existe un k > 0 tal que L < sup a n < L + e. 

k>0n>k n>k 

Si L — sup a n , entonces existe un n > k tal que L — e < a n < L. Si por el 

n>k 

contrario L < sup a n < L + e, entonces existe un n > k tal que L < a n < L + e. 

n>k 

En cualquier caso existe un n > k tal que a n G ]L — e, L + e[. Esto significa 
que L es un punto adherente de la sucesión, luego L < líma„ y tenemos la 

n 

igualdad. ■ 
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Por la propia definición es claro que si una sucesión converge en M. entonces 
su límite, que es su único punto adhcrcnte, coincide con su límite superior. 
Ahora podemos probar: 



Teorema 3.26 Sea ^ a n (z — a) n una serie de potencias, sea R = 1/lím v/|a n | 

(entendiendo que 1/0 = +oo y l/(+oo) = 0/. Entonces la serie converge abso- 
luta y uniformemente en todo compacto contenido en B R (a) y diverge en todo 
punto deC \ B R (a) (las bolas se toman respecto a la norma euclídea. Conveni- 
mos que B +QC (a) = C). En particular la serie converge absoluta y puntualmente 
en B R (a) a una función continua. 



DEMOSTRACIÓN: Sea K un compacto en B R {a). Veamos que la serie con- 
verge absoluta y uniformemente en K. La función \x — a\ es continua en K, 
luego alcanza su máximo r en un punto x € K, es decir, \x — a\ = r y para todo 
y £ K se cumple \y — a\ < r. Así K C B r (a). 

Como x € B R {a) ha de ser r < R, luego rlím \/|a„| < 1. Tomemos p tal 

n 

que rlím Á¡/|a„| < p < 1. Como lím ^/|a ra | = ínf sup Á/|a n |, existe un natural 

n n k>0n>k 

k tal que sup \/|a„| < p/r, luego si n > k se cumple ^/|a„| < p/r y por lo 

n>k 

tanto \a n \r n < p n . 

Si y G K entonces \y — a\ < r, luego \y — a\ n < r n , luego \a n (y — a) n \ < 

oo oo 

|a„|r™ < p n . Así pues, la serie Yl a n{y — a ) n es tá mayorada en K por P"i 

n—k n—k 

que es convergente por ser geométrica de razón menor que 1. El criterio de 
Weierstrass nos da que la serie de potencias converge absoluta y uniformemente 
a una función continua en K. Todo punto de B R (a) tiene un entorno compacto 
contenido en B R (a) (una bola cerrada de radio adecuado), luego la suma es 
continua en B R (a). 

Ahora veamos que la serie diverge en C\B R (a). Sea x € C tal que \x— a\ > R. 
Entonces 1 < \x — a\ lím Á¡/|a„|. Por lo tanto, para todo natural k se cumple 

n 

l/\x — a\ < sup Á/|a„|, luego existe un n > k tal que ^/|a„||x — a\ > 1, o sea, 

n>k 

\a n (y — a) n \ > 1. Esto significa que a n (y — a) 11 no tiende a 0, luego la serie 
diverge. ■ 

El número R se llama radio de convergencia de la serie de potencias. La bola 
B R {a) se llama disco de convergencia. Tenemos, pues que una serie de potencias 
converge absolutamente en su disco de convergencia y diverge en los puntos 
exteriores a él (los puntos interiores de su complementario). En cada punto de 
la frontera del disco la serie puede converger absolutamente, condicionalmente 
o diverger, según los casos. 



A la hora de determinar el radio de convergencia de una serie suele ser útil 
el teorema siguiente: 



3.6. Seríes de potencias 
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Teorema 3.27 Sea ^ a n (z — a) n una serie de potencias tal que exista 

n=0 

límW=£. 



Entonces su radio de convergencia es 1/L. 

Demostración: Por el teorema anterior, el radio de convergencia de la 

oo 

serie dada es el mismo que el de la serie l a nl z ™- Si a; > 0, tenemos que 

lim — ¡ — = Lx, 

luego el criterio de D'Alembert implica que la serie converge cuando Lx < 1 y 
diverge si LX > 1. Consecuentemente el radio de convergencia ha de ser 1/L. 



Las series de potencias se pueden derivar término a término. Conviene pro- 
bar un resultado un poco mas general: 

Teorema 3.28 Sea {fn}^! una sucesión de funciones f n : ]a,b[ — > IR que 
converge uniformemente a una función f. Supongamos que todas ellas son de- 
rivables en ]a,b[ y que la sucesión de derivadas converge uniformemente a una 
función g. Entonces f es derivable y g = f. 

Demostración: Fijemos un punto x € ]a 7 b[ y consideremos las funciones 

Fn(y) = \ f ,*-v s ) v ^ x 

1/nW siy = x 

Similarmente definimos F : ]a, b[ — > IR mediante 

„, , / /(a:) ' /fa) si y ± x 

F(y) = i , r s . 

1 9(x) siy = x 

El hecho de que /„ sea derivable en x implica que F n es continua en ]a, b[. 
Basta probar que para todo e > 0 existe un número natural no tal que si m, n > 
n 0 e y G ]a, b[ entonces \F m (y)—F n (y) \ < e. En efecto, esto significa que {F n }^ =1 
es (uniformemente) de Cauchy, luego según el teorema 2.54 la sucesión ha de 
converger uniformemente a alguna función continua, pero dado que converge 
puntualmente a F, de hecho convergerá uniformemente a F. Tenemos, pues, 
que F es continua y a su vez esto implica que / es derivable en a; y f'(x) — g(x). 

Existe un número natural no tal que si m, n > no entonces 

\fn(u) ~ f m {u)\ < | para todo ue]a,b[. 
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Entonces, dados y € ]a, b[ y m, n > n 0 , si y ^ x se cumple 

fn(x) - f n (y) f m (x) - J m {y) 



\F n (y) - F m (y)\ 



< 



1 

x-y 



x — y x — y 

\fn(x) - f m (x) - f n (y) + f m (y)\ 



Aplicamos el teorema del valor medio a la función /„ — f m en el intervalo 
[y, x] (suponemos, por ejemplo, y < x). Entonces existe un u G ]a, b[ tal que 

fn(x) - fm(x) - f n (y) + fm(y) = (fú( u ) ~ fL( u ))( x ~ V) ■ 

Así pues, 

\F n (y) - F m (y)\ < 
Así mismo, si y = x tenemos 



x-y 



\f'Áu)-Uu)\\x-y\<-. 



\F n {x)-F m {x)\ = \f n {x)-f' m {x)\<-<e. 



Como consecuencia tenemos: 

oo 

Teorema 3.29 Sea a n {x — a) n una serie de potencias con centro y coe- 

n=0 

oo 

ficientes reales. Supongamos que tanto ella como la serie na n (x — a)" -1 

convergen en un intervalo ]a — e, a + e[. Entonces la segunda serie es la deri- 
vada de la primera. 

Llamemos f(x) a la función definida sobre ]a — e, a + e[ por la serie dada y 
g(x) a la función definida por la segunda serie. Hemos de probar que f'(x) = 
g(x) para todo x en el intervalo. 

n 

Sea f n (x) = ^2 a n (x — a) n . Se trata de una sucesión de polinomios cuyas 

fc=0 

derivadas f' n (x) son las sumas parciales de la segunda serie. Dado un punto 
x € ]a — e, a + e[, tomamos un intervalo cerrado [x — 5, x + S] C ]a — e, a + e[. 
Por el teorema 3.26, en este intervalo las sucesiones f n (x) y f' n {x) convergen 
absoluta y uniformemente a / y g respectivamente. ■ 

El lector puede demostrar que, en realidad, las dos series del teorema anterior 
tienen el mismo radio de convergencia, con lo que la hipótesis sobre la conver- 
gencia de la segunda es redundante. En la práctica no necesitaremos este hecho, 
pues es obvio que si existe lím — ¿ entonces el límite correspondiente a 

la segunda serie también existe y vale lo mismo. 

Con los resultados que veremos en la sección siguiente sobre la función expo- 
nencial es fácil probar esto mismo pero sobre lím >/|a n |, con lo que obtenemos 



3. 7. La función exponencial 
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la igualdad de los radios de convergencia en el caso general. De aquí se sigue 
inmediatamente que una serie de potencias con coeficientes y centro reales es 
una función de clase C°° en su intervalo real de convergencia, y además coincide 
con su serie de Taylor. 



3.7 La función exponencial 

Vamos a aplicar las ideas de las secciones precedentes a la construcción de 
las funciones más importantes del análisis: la exponencial, la logarítmica y las 
trigonométricas. En esta sección nos ocuparemos de la función exponencial. 

Hasta ahora tenemos definido a r cuando a es un número real positivo y r 
es un número racional. No es difícil probar que la función r i— > a r admite una 
única extensión continua a R que sigue conservando la propiedad a x+y = a x a y . 
Además esta función es infinitamente derivable y coincide en todo punto con 
su serie de Taylor en 0. En lugar de probar todos estos hechos lo que haremos 
será definir la función exponencial a partir de su serie de Taylor, para lo cual 
no necesitaremos siquiera el hecho de que ya la tenemos definida sobre Q. No 
obstante, ahora vamos a suponer la existencia de la función a x , así como que es 
derivable, y vamos a calcular su serie de Taylor. Así obtendremos la serie que 
deberemos tomar como definición. 

Sea f(x) = a x . Entonces, 

f(x) = lím — — = a x lím ^— - = a x f(0). 

J y ' h^o h h^o h J w 

Llamemos k — /'(O). Entonces hemos probado que f'(x) — kf(x), luego por 
inducción concluimos que / es infinitamente derivable y f n \x) = k n f(x). No 
puede ser k = 0, o de lo contrario / sería constante. Sea e = o}l k = f(l/k). 
Entonces la función g(x) — e x = a x l k = f(x/k) cumple g'(x) = f'(x/k)(í/k) = 
f(x/k) = g(x), es decir, escogiendo adecuadamente la base e obtenemos una 
función exponencial que coincide con su derivada. Su serie de Taylor en 0 es 
entonces fácil de calcular: todas las derivadas valen e° = 1, lo cual nos lleva a 
la definición siguiente: 

Definición 3.30 Llamaremos función exponencial a la definida por la serie de 
potencias 



ni 

n=0 



Puesto que 



„ í/(n + l)\ „ 1 „ 
lím , , = lím - = 0, 

n 1/nl n n 



el radio de convergencia es infinito, luego la exponencial está definida sobre 
todo número complejo z. El último teorema de la sección anterior implica que 
la exponencial real es derivable, y su derivada en un punto x es 

~ ggn-l _ ~ x n-l _ ~ x n _ ^ 

^ ni ~ ^ (n- 1)1 ~ ^ ni ~ & ' 

n—\ n—1 n—0 
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Es claro que e° = 1. Definimos el número 



oo 

¿ — ' n 



2, 7182818284590452353602874. . . 

Ahora probamos la ecuación que caracteriza a la función exponencial: 
Teorema 3.31 Si z\, z 2 € C, entonces e ^ 1+Z2 = e Zl e Z2 . 

DEMOSTRACIÓN: Usamos la fórmula del producto de Cauchy: 



oo n oo n oo n 

EZ\ ^2 k n- 

n=0 n=0 n=0 fe=0 V ' 



n=0fe=0 ' V 7 n=0 



De aquí obtenemos muchas consecuencias. Por una parte, si n es un número 

71 TI 

natural no nulo entonces e™ = e 1H hl = e • • • e, es decir, la función exponencial 
sobre números naturales (incluido el 0) coincide con la exponenciación usual 
con base e. Así mismo, 1 = e° = e x ~ x = e x e~ x , luego e~ x = l/e x , con lo que 
la función exponencial coincide también con la usual cuando el exponente es 
entero. 

Como los coeficientes de la serie exponencial son positivos, vemos que si 
x > 0 entonces e x > 0, y si x < 0 entonces e x = \¡e~ x > 0. Así pues, e x > 0 
para todo número real x. 

Como, (e 1 /™)™ = e i/n+-+i/n = e i = e5 resu lta que e 1 /™ = ¡f e . Es fácil ver 
ahora que e p l q — ^/e p , luego la función exponencial coincide con la que teníamos 
definida para exponentes racionales. 

Puesto que la derivada es positiva en todo punto, vemos que la función expo- 
nencial es estrictamente creciente en K. En particular es inyectiva. Separando 
los dos primeros términos de la serie vemos que si x > 0 entonces 1 + x < e x , 
luego lím e x = +oo. A su vez esto implica que 

z^+oo 

lím e x = lím e~ x = lím — = 0. 

x^ — oo x— *+oo z^+oo c x 

Por el teorema de los valores intermedios, la función exponencial biyecta K 
con el intervalo ]0, +oo[. 

Ejemplo Aplicando n veces la regla de L'Hópital se concluye claramente que 

x n 

lím — = 0, 
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y cambiando x por 1/x llegamos a que 

— l/x 

lím =0, n = 0,1,2,... (3.5) 

Esto implica que la función h : R — > R dada por 



/i(a;) 



e 1/,;r si x > 0 
0 si x < 0 



es de clase C°° en R. En efecto, una simple inducción prueba que las derivadas 
de h para x > 0 son de la forma 

e -l/x 

x n y ' 

donde P{x) es un polinomio. De aquí que las derivadas sucesivas de h en 0 
existen y valen todas 0. En efecto, admitiendo que existe h k \Q) = 0 (para 
k > 0) la derivada h k+1 \0) se obtiene por un límite cuando Ax — > 0 que por la 
izquierda es claramente 0 y por la derecha es de la forma 

e -l/Ax 

lím — P(Ax), 

Ax^o+ Ax n y ' 

de modo que el primer factor tiende a 0 por (3.5) y el segundo está acotado en 
un entorno de 0. Por lo tanto existe h k+1 \0) = 0. 

En particular, la función h(x 2 ) es de clase C°°, sus derivadas son todas nulas 
en 0 pero es no nula en todo punto distinto de 0. Tenemos así un ejemplo de 
función de clase C°° cuya serie de Taylor en 0 sólo converge (a ella) en 0. ■ 

La función h del ejemplo anterior permite construir una familia de funciones 
que nos serán de gran utilidad más adelante: 

Teorema 3.32 Dados números reales 0 < a < b existe una función f : R — > IR 
de clase C°° tal que f(x) > 0 si x G ]a, b[ y f(x) = 0 en caso contrario. 

Demostración: En efecto, la función h\{x) = h(x — a) se anula sólo en 
los puntos x < a y la función h 2 (b — x) se anula sólo en los puntos x > b. Su 
producto se anula sólo en los puntos exteriores al intervalo x G ]a, b[. m 



Definición 3.33 Llamaremos función logarítmica a la inversa de la función 
exponencial, log : ]0,+oo[ — > R. 



He aquí las gráficas de las funciones exponencial y logarítmica. 
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El teorema de la función inversa nos da que y = logx es derivable, y su 
derivada es y' = l/(e y )' = l/e y = 1/x. 

De las propiedades de la función exponencial se deducen inmediatamente las 
de la función logarítmica. Obviamente es una función estrictamente creciente, 
además verifica la ecuación funcional \og{xy) — logx + log y. También es claro 
que log 1=0, log e = 1 y 

lím loga; = +oo, lím loga; = — oo. 

Veamos cómo puede calcularse en la práctica un logaritmo. Es decir, vamos 
a calcular el desarrollo de Taylor de la función log. Obviamente no hay un 
desarrollo en serie sobre todo ]0, +oo[. Si desarrollamos alrededor del 1 a lo 
sumo podemos obtener una serie convergente en ]0, 2[. 

Como las series de potencias centradas en 0 son más fáciles de manejar, 
vamos a desarrollar en 0 la función log(l + x). Sus derivadas son 

(1 + x)- 1 , -(1 + a;)- 2 , 2(1 + x)- 3 , -2 -3(1 + a;)- 4 ,... 

y en general, la derivada n-sima es (— l) Tl+1 (n — 1)!(1 + x)~ n . Puesto que 
log(l + 0) = 0, la serie de Taylor queda: 

yL^l — 3». 

^ n 

n=l 



Como 



lím^ + ^lím- 



1/n n n + 1 



el radio de convergencia es 1 (como era de esperar), luego la serie converge en 
]— 1,1[. De hecho en x = —1 obtenemos una serie divergente, pero en x = 1 

00 (-i) n+1 

queda — — ¡ q ue es convergente luego, con exactitud, la serie converge en 

n=l ™ 

el intervalo ]— 1, 1]. 
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Según hemos visto en la sección anterior, la función definida por la serie es 
derivable, y su derivada se obtiene derivando cada monomio, es decir, se trata 
de la serie geométrica 



oo oo 



- + X 

n—0 



Resulta, pues, que la serie de Taylor y la función log(l + x) tienen la misma 
derivada en ] — 1,1[. Por lo tanto la diferencia entre ambas funciones es una 
constante, pero como ambas toman el valor 0 en 0, se concluye que 



(— 1 ) n+1 
log(l + x) = y x r 

n=l 



para todo número x € ]— 1, 1[. 

Ejercicio: Estudiando el resto de Taylor de la función log(l + x), probar que 

(_!)»+! 



Para calcular el logaritmo de un número x > 2 podemos usar la relación 
log(l/a;) = — loga;. 

Ahora podemos definir a x para cualquier base a > 0. La forma más fácil de 
hacerlo es la siguiente: 

Definición 3.34 Sea a > 0 y x € R. Definimos a x = e xXo&a . 

Notar que, como loge = 1, en el caso a = e la exponencial que acabamos 
de definir coincide con la que ya teníamos definida. Sin embargo la función 
e x se diferencia de las otras exponenciales en que está definida sobre todo el 
plano complejo y no sólo sobre la recta real. Más adelante interpretaremos 
esta extensión compleja. Las funciones exponenciales verifican las propiedades 
siguientes: 

e (x+y)loga _ £ x log a £ y log a _ fl a; fl y 

log e xloga = xloga, 

e 2/loga x _ e xj/loga _ ^xy 

1, a 1 =a, ar x = \ja x . 

Así mismo es claro que a x coincide con la exponenciación usual cuando x es 
un número entero y que sobre números racionales es a p / q = ffaP. La función 
y x considerada como función de dos variables en ]0, +oo[ x R es continua. 

La derivada de a x es (log a)a x , la derivada de x b es 



a x+y = 

log a x = 

(a x ) y = 

a° = 



e blo ^ b = 1 bx b = bx b - 1 . 

X X 
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Finalmente, puesto que la derivada de a x es siempre positiva si a > 1 y 
siempre negativa si a < 1, tenemos que a x es monótona y biyecta R con el 
intervalo ]0, +oo[. Por lo tanto tiene una inversa, que representaremos por 
log a a; y se llama logaritmo en base a de x. Las propiedades algebraicas de estos 
logaritmos son las mismas que las de la función log y se demuestran igual. A 
estas hay que añadir las siguientes, ambas elementales: 

!og a x b = b log a x, log b x = . 

En particular 

loga; 

log Q x = . 

a log a 

Hay una caracterización importante del número e: 
Teorema 3.35 Se cumple 

e = lím ( 1 H 

x^+co y x 

Demostración: Por definición 



luego basta probar que 



= e xlos{1+1/x) , 



lím x log I 1 + — ) = 1 . 



x— >+oo \ X 



Pasamos la x al denominador como 1/x y aplicamos la regla de L'Hópital, 
con lo que el límite se transforma en 

-x- 2 

lím 1+1 ^ x = lím — = 1. 

x^+cc —x 1 a;->+oo 1 + \ jx 



Ejercicio: Probar que, para todo 

e" = lím + 

n \ n) 



Terminamos la sección con una aplicación de los logaritmos junto a técnicas 
analíticas. 
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Ejemplo Se define la media aritmética de n números reales X\, . . . ,x n como 

(x\ H h x n ) /n. Si son mayores o iguales que 0 se define su media geométrica 

como ^Jx\ ■ ■ ■ x n . Vamos a probar que la media geométrica siempre es menor 
o igual que la media geométrica. A su vez, deduciremos esto de la desigualdad 
log t < t — 1, válida para todo t > 0. 

Para probar esta desigualdad vemos que la derivada de f(t) = t — 1 — logí 
es 1 — í/t, que es negativa si t < 1 y positiva si t > 1. Por el teorema 3.14, 
/ es decreciente en ]0, 1] y creciente en [l,+oo[. Puesto que /(l) = 0, es claro 
entonces que f(t) > 0 para todo t > 0. 

Respecto a la desigualdad entre las medias, si uno de los números es nulo la 
media geométrica es nula y el resultado es obvio. Supongamos que son todos 
no nulos y Entonces 

"7= - 1 > lo S^7=, 

yx yx 

luego sumando obtenemos 

X\ x n 

n > log = 0, 

x 

con lo que 

n 

E x i 

n 



n 




3.8 Las funciones trigonométricas 

En geometría se definen varias funciones de interés, entre las que destacan 
las funciones seno y coseno. Si llamamos i? a la medida de un ángulo recto, 
entonces la función senx está definida sobre R y tiene periodo 4i?, es decir, 
sen(x + 4i?) = sen x para todo Así definido, el valor de R es arbitrario, 

pues podemos tomar cualquier número real como medida de un ángulo recto. 
Si queremos que existan ángulos unitarios deberemos exigir que R > 1/4. Por 
ejemplo, si tomamos como unidad de ángulo el grado sexagesimal, entonces 
R = 90. Supongamos que las funciones seno y coseno son derivables así como 
sus propiedades algebraicas y vamos a calcular su serie de Taylor. Con ello 
obtendremos una definición analítica alternativa. 

En primer lugar, como el coseno tiene un máximo en 0, ha de ser eos' 0 = 0. 
En cualquier otro punto tenemos 

, cosía; + h) — eos x eos x eos h — sen x sen h — eos x 

eos x = lim = lim 

ft.^o h h-yO h 

eos h — 1 , , sen h 

= eos x lim sen x lim — - — 

h^o h h^o h 

= eos x eos' 0 — sen x sen' 0 = — sen x sen' 0. 
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Si llamamos k — sen' 0 concluimos que cos'x = — fcsenx, y similarmente 
llegamos a que sen'x = kcosx. 

Del mismo modo que hicimos con la exponencial, podemos normalizar las 
funciones seno y coseno cambiándolas por sen(x/k) y cos(x/k). Geométricamen- 
te esto significa fijar una unidad de ángulos. Entonces tenemos sen' x = eos x y 
eos' x = — sena;. 

Vemos entonces que las funciones seno y coseno son infinitamente derivables, 
y sus derivadas están uniformemente acotadas por 1, luego las series de Taylor 
deben converger en R a las funciones respectivas. Puesto que senO = 0 y 
cosO = 1, las series han de ser las que consideramos en la definición siguiente: 

Definición 3.36 Llamaremos seno y coseno a las funciones definidas por las 
series de potencias 

senz = Y ,} \„ z 2n+1 , cosz = V V^z 2 ". 
(2n+ 1) ¿-r (2n) 

n=0 v ; n=0 y ' 

No es difícil probar directamente la convergencia de estas series sobre todo el 
plano complejo. El teorema siguiente muestra una sorprendente conexión entre 
las funciones trigonométricas así definidas y la función exponencial. Observar 
que la prueba contiene otra demostración alternativa de la convergencia de estas 
series. 

Teorema 3.37 Para todo z € C se cumple 

e lz - e~ lz e lz + e~ lz 

sen z = , eos z = . 

2i 2 

Demostración: 

oo oo 

V i n — 4- V í — i\ n — 

e t e _ n=0 n —Q _ \^-\ i {—i; z 

2 _ 2 _ ¿-í 2 ~n~V 

Ahora bien, la sucesión [i n +(—i) n )/2 es simplemente 1, 0, —1, 0, 1, 0, —1, 0. . ., 
luego queda la serie del coseno. Similarmente se razona con el seno. ■ 

Derivando término a término las series de Taylor se concluye fácilmente que 

sen' x — eos x, eos' x — — sen x. 

Las fórmulas siguientes son todas consecuencias sencillas del teorema ante- 
rior: 

sen 2 z + eos 2 z = 1 
sen(x + y) = sen x eos y + eos x sen y, 
cos(x + y) = eos x eos y — sen x sen y, 
e lz — cosz + zsenz, 
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La primera fórmula implica que si x £ IR entonces — 1 < senx, cosa; < 1. De 
la última se sigue que para todo x, y G R se cumple 

e X+iy _ £ X ^ COg y ^ ^ 

con lo que tenemos descrita la exponencial compleja en términos de la exponen- 
cial real y de las funciones seno y coseno reales. 

El hecho de que sen' 0 = eos 0=1 equivale a 

sen x 
hm = 1, 

x—>0 X 

que es otra propiedad del seno que conviene recordar. 

Vamos a probar ahora la periodicidad de las funciones trigonométricas reales. 
El punto más delicado es demostrar que eos x se anula en algún x ^ 0. Para ello 
probaremos que el coseno es menor o igual que los cuatro primeros términos de 
su serie de Taylor: 



eos x < 1 — 




Esto equivale a probar que 1 — x 2 /2 + x 4 /24 — eos x > 0 para x > 0. Puesto 
que esta función vale 0 en 0, basta probar que su derivada es positiva. Dicha 
derivada es senx — x + x 3 /6. Esta función vale también 0 en 0, luego para probar 
que es positiva (para x > 0) basta ver que su derivada lo es. Dicha derivada es 
cosa; — 1 + x 2 /2. Por el mismo argumento derivamos una vez más y obtenemos 
x — senx. Al derivar una vez más llegamos a 1 — cosa;, que sabemos que es 
positiva. 

Vemos que la gráfica del polinomio de Taylor de 
grado 4 en 0 de cosa; toma valores negativos. De 
hecho un simple cálculo nos da que en V3 toma el 
valor —1/8, luego eos V3 < -1/8. Como cosO = 1, 
por continuidad existe un punto 0 < x < \/3 tal que 
cosa; = 0. 

Sea A — {x > 0 | cosa; = 0}. El conjunto A es la 
antiimagen de {0} por la aplicación coseno restringida 
a [0, +oo[. Como {0} es cerrado y eos es continua, A 
es un cerrado. El ínfimo de un conjunto está en su -i 
clausura, luego F = íníA £ A y así cosF = 0. Es obvio que F > 0, y como 
eos 0 ^ 0, ha de ser 0 < F < y/3. 

Es costumbre llamar n = 2F. Así, se cumple 0 < tt < 2"\/3, cos(-7r/2) = 0, 
pero cosa; > 0 en el intervalo [0,7r/2[. 

Ahora, como el coseno es la derivada del seno, resulta que sen x es estricta- 
mente creciente en el intervalo [0,7r/2]. Como senO = 0, resulta que sena; > 0 
en [0, 7r/2]. Concretamente, sen(7r/2) es un número positivo que cumple 

sen 2 (7r/2) + cos 2 (tt/2) = sen 2 (7r/2) +0=1, 

luego sen(7r/2) = 1. 
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Además, eos' a; = — senx < 0 en [0,7r/2], luego el coseno es estrictamente 
decreciente en [0, ir/ 2]- En resumen, tenemos demostrado lo que refleja la gráfica 
siguiente: 




Incidentalmente hemos probado una desigualdad que a veces es de interés: 
si x > 0 entonces sena; < x. Más en general, |sena;| < \x\. 

El comportamiento de las funciones seno y coseno fuera del intervalo [0, 7r/2] 
se deduce de las relaciones trigonométricas que ya hemos probado. Por ejemplo, 
expresando ir = 7r/2 + 7r/2 obtenemos sen n = 0, eos n = —1, y a su vez de aquí 
sen2-7r = 0, cos27r = 1. Ahora 

sen(a; + 2n) = sen x, cos(x + 2n) = eos x 7 

lo que prueba que ambas funciones son periódicas y basta estudiarlas en el 
intervalo [0,27r]. Dejamos a cargo del lector completar la descripción de estas 
funciones. A partir de lo que ya hemos probado es fácil obtener todos los 
resultados que se demuestran en geometría. Nos limitaremos a mostrar sus 
gráficas en [0, 2ir]: 




El teorema siguiente se demuestra de forma más natural en geometría, pero 
vamos a probarlo para tener una construcción completamente analítica de las 
funciones trigonométricas: 

Teorema 3.38 Sea z € C, z ^ 0 y sea a € R. Entonces existe un único número 
real 6 € [a, a + 2tt[ tal que z = \z\e %e = |z|(cos# + isen9). 

Demostración: Sea z/\z\ = x + iy. Entonces x 2 + y 2 = 1. Distinguimos 
cuatro casos: según el signo de x e y. Todos son análogos, así que supondremos 
por ejemplo x < 0, y > 0. Más concretamente tenemos —1 < x < 0. En el 
intervalo [tt, 3ir/2] se cumple cos7r = —1, cos37r/2 = 0, luego por continuidad 
existe un número </> € [7r,37r/2] tal que cos</> = x. Entonces 1 = x 2 + y 2 = 
eos 2 (f) + sen 2 <j), por lo que y 2 = sen 2 (f> y, como ambos son negativos, ha de ser 
y = sencf). Así pues, z — |z|(cos 0 + ¿sen cj)) = \z\e 1 ^ . 

Existe un número entero p tal que 9 = 2pn + <p £ [a,a + 2n[. Entonces, 
teniendo en cuenta que e 2p7Tt = 1, resulta que z — |z|e 4 ^e 2p7rí = \z\e t6 . 
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La unicidad se debe a que si \z\e 101 = \z\e 102 , entonces e^ 01-02 ^ = 1, luego 
cos(é*i — 62) = 1 y sen(#i — 9 2 ) = 0, ahora bien, cosx = 1 y senx — 0 sólo ocurre 
en x = 0 en el intervalo [0, 27r[, luego sólo ocurre en los números reales de la 
forma 2kir, con k € Z. Así pues 61 — 62 = 2kir, y si ambos están en el intervalo 
[a, a + 2n[, ha de ser 6\ = 62- ■ 

Un argumento de un número complejo z ^ 0 es un número real 9 tal que 
z = \z\e %B . Hemos probado que cada número complejo no nulo tiene un único 
argumento en cada intervalo [a, a + 2ir[. En particular en el intervalo [0, 2n[. 

Recordemos que para conseguir que la derivada 
del seno fuera el coseno hemos tenido que fijar una 
medida de ángulos concreta. El ángulo de medida 1 
respecto a esta unidad, es decir, el ángulo que forman 
los vectores (1,0) y (eos 1, sen 1), recibe el nombre de 
radián 1 La figura muestra un radián. 

Las funciones seno y coseno nos permiten mostrar 
algunos ejemplos de interés sobre derivabilidad. 




Ejemplo La función / : IR — > IR dada por 

/(*) = 



x 2 sen i si x ^ 0 
0 si x = 0 



es derivable en IR. El único punto donde esto no es evidente es x = 0, pero 

/'(0) = lím/isen! =0. 

Para probar esto observamos en general que el producto de una función 
acotada por otra que tiende a 0 tiende a 0 (basta aplicar la definición de límite). 
Sin embargo la derivada no es continua, pues en puntos distintos de 0 vale 

f'(x) = 2xsen — — eos — , 
x x 

y es fácil ver que el primer sumando tiende a 0 en 0 (como antes) , mientras que 
el segundo no tiene límite, luego no existe lím f'(x). 

Los mismos cálculos que acabamos de realizar prueban una limitación de la 
regla de L'Hópital. Consideremos la función g(x) = x. Entonces 

lím 44 = 0, 



X E1 nombre se debe a que, según probaremos en el capítulo siguiente, si un arco de circun- 
ferencia mide un radián, entonces su longitud es igual al radio. Sería más adecuado llamarlo 
ángulo "radiante" . 
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pero si intentamos calcular el límite por la regla de L'Hópital nos encontramos 
con 

/'(*) 



lím 



límf'(x] 

x—>0 



x^o g'(x) 

y ya hemos visto que este límite no existe. La regla de L'Hópital sólo afirma que 
si existe el límite del cociente de derivadas también existe el límite original y 
ambos coinciden, pero es importante recordar que si el segundo límite no existe 
de ahí no podemos deducir que el primero tampoco exista. ■ 

Otra función trigonométrica importante es la tangente, definida como 



tan z = 



sen z 
eos z ' 



No es difícil probar que la función coseno se anula únicamente sobre los 
múltiplos enteros de 7r/2 (no tiene ceros imaginarios). En efecto, si cosz = 0, 
por definición e tz +e~ tz = 0, luego e 2lz = —1. Si z = a+bi, queda e 2la e~ 2b = -1 
y tomando módulos, e~ 2b = 1, luego b = 0 y z es real. Igualmente ocurre con el 
seno. Por lo tanto la tangente está definida sobre todos los números complejos 
que no son múltiplos enteros de n/2. Claramente su restricción a IR es derivable 
en su dominio, y su derivada es 1/ eos 2 x = 1 + tan 2 x. En particular es siempre 
positiva, luego la tangente es creciente. Su gráfica es: 




Es fácil ver que la función tangente biyecta el intervalo ]— 7r/2,7r/2[ con la 
recta real. Junto con ésta, tenemos también las biyecciones siguientes: 



sen : 



7T 7T 

2' 21 



-1, 1], eos : [0, 7r] 



-1,1]. 



Por lo tanto podemos definir las funciones inversas, llamadas respectiva- 
mente, arco seno, arco coseno y arco tangente: 



aresen : [—1,1] 



2' 2 



, arceos : [—1,1] — > [0,7r], 



arctan : M. — > ]— tt/2, tt/2[ . 
El teorema de la función inversa permite calcular sus derivadas: 

1 -1 1 



a re: sen x 



Vl^x 2 ' 



arceos x - 



arctan' x 



1 + x 



2 ' 
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Por ejemplo, si y = arcsenrr, entonces x = sen y, luego ^ = eos y, luego 

dy _ 1 1 1 

dx eos y _ S en 2 y \J\-x 1 ' 

Vamos a calcular la serie de Taylor de la función arco tangente. No podemos 
calcular directamente las derivadas, pues las expresiones que se obtienen son 
cada vez más complicadas y no permiten obtener una fórmula general. En su 
lugar emplearemos la misma técnica que hemos usado en la sección anterior 
para calcular la serie del logaritmo. Claramente 



1 1 



^(-l)"x 2n , para \x\ < 1. 



1 + x 2 1 - (-X 2 ) ^ 
Ahora es fácil obtener una serie cuya derivada sea la serie anterior, a saber: 

E \ L ) 2n+l 
2n + l X ■ 

n—0 

Es fácil ver que su radio de convergencia es 1. 

Por lo tanto esta serie se diferencia en una constante de la función arctan re 
en el intervalo ] — 1, 1[, pero como ambas funciones toman el valor 0 en x = 0, 
concluimos que son iguales, o sea: 

arctan a; = > -x 2n+1 , para larl < 1. 

n=0 

Cuando x = ±1 la serie se convierte en una serie alternada cuyo término 
general es decreciente y tiende a 0, luego por el criterio de Leibniz también 
converge. No vamos a demostrarlo aquí (ver la pág. 237), pero el límite resulta 
ser arctan(±l). Puesto que arctan 1 = 7r/4, esto nos lleva a la conocida fórmula 
de Leibniz para el cálculo de ir: 

A (, 1 1 1 1 1 

7T = 4 1 1 1 Y ■ 

\ 3 5 7 9 11 

Esta fórmula converge muy lentamente a 7r, en el sentido de que es necesario 
calcular muchos términos para obtener pocas cifras exactas. Hay otras expresio- 
nes más complicadas pero más eficientes. Veamos una de ellas. Es fácil probar 
la fórmula de la tangente del ángulo doble: 



tan2a = 

De aquí se sigue que 



2 tana 
1 — tan 2 ol 



1\ 5 / 1\ 120 

tan 2 arctan = — , tan 4 arctan - = . 

5/12' V 5/119 
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Teniendo en cuenta que arctan(— x) = — arctan a; resulta 



tan f 4arctan ^ — arctan — !— J = 119 120 23 1 9 



120 1_ 

239 

120 

119 239 



con lo que, finalmente, 



1 1 

7T = 4 ( 4 arctan - — arctan — — 
5 239 



o sea, 



(-l) n 4 

7T = > — — 

^ 2n + 1 



5 2n+l 2392"+! 



n=0 

Esta serie converge muy rápidamente. Veamos sus primeras sumas parciales: 

0 3,18326359832635983263598326360 

1 3,14059702932606031430453110658 

2 3,14162102932503442504683251712 

3 3,14159177218217729501821229111 

4 3,14159268240439951724025983607 

5 3,14159265261530860814935074767 

6 3,14159265362355476199550459382 

7 3,14159265358860222866217126049 

8 3, 14159265358983584748570067225 

9 3,14159265358979169691727961962 

10 3, 14159265358979329474737485772 

1 1 3, 14159265358979323639184094467 

12 3, 14159265358979323853932459267 

13 3,14159265358979323845978816126 

14 3,14159265358979323846275020768 

15 3,14159265358979323846263936981 

Vemos que con 6 sumas tenemos ya una aproximación con diez cifras exactas, 
y con 15 superamos las 20 cifras. 

*Las funciones hiperbólicas El lector que esté familiarizado con la geo- 
metría hiperbólica habrá notado la similitud formal entre las fórmulas del teo- 
rema 3.37 y las definiciones de las razones trigonométricas hiperbólicas. Esta 
similitud se traduce en las relaciones siguientes: 

e x — e~ x e i{-ix) _ e -i(-ix) senix 

senha; = = = isem—ix) = , 

2 2 x ' i 

e x _|_ e -x e i(-ix) _|_ g-i(-jx) 

cosha; = = = cosí— ¿ai) = cosía;. 



2 

En definitiva, tenemos 



sen(¿a;) = i senha;, 
cos(¿a;) = cosha;, 
tan(¿a;) = i tanhx. 
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De aquí se siguen, por ejemplo, las relaciones cosh 2 a; — senh 2 a; = 1, o las 
fórmulas del seno y el coseno de una suma, etc. 

Ejercicio: Deducir de las relaciones anteriores las series de Taylor de las funciones 
senh x y cosh x. 

A partir de las definiciones es fácil probar 

senh' x = cosh x, cosh' x = senh x, tanh' x = \¿ — 1 — tanh 2 x. 

cosh x 

Puesto que cosh a; > 0, el seno hiperbólico es creciente. De hecho es una 
función biyectiva, como puede probarse a partir de la propia definición: Si 
x = senh y entonces 

e y - e- y - 2x = 0, => e 2y - 2xe y - 1 = 0, e y = x + v^ 2 + 1, 

luego la inversa del seno hiperbólico es la función argumento del seno hiperbólico 
dada por 

argsenha; = log(x + \¡ x 1 + 1 ) . 

Teniendo en cuenta su derivada, el coseno hiperbólico es decreciente en 
]— oo,0] y creciente en [0, +oo[. Como coshO = 1, la imagen está en [l,+oo[. 
Existe la inversa arg cosh : [1, +oo[ — > [0, +oo[ dada por 

arg cosh x = \og(x + \J x 1 — 1 ) . 
Teniendo en cuenta las relaciones 

tan 2 x = 1 — , tanh(— x) = — tanhai, 

cosh x 

es claro que tanh : IR — > ]— 1,1[ es biyectiva, luego tiene como inversa a la 
función arg tanh : ]— 1, 1[ — > R. 

Dejamos a cargo del lector el cálculo de las derivadas de los argumentos 
hiperbólicos. ■ 

* Geometrías no euclídeas Los resultados de esta sección nos permiten 
mostrar una conexión importante entre la geometría euclídea y las geometrías 
elíptica e hiperbólica. Antes de entrar en ello, observemos que en la geometría 
euclídea existe una asimetría entre la medida de longitudes y la medida de 
ángulos. En efecto, no es posible definir geométricamente una unidad de longi- 
tud. El metro se define actualmente en términos del segundo y de la velocidad 
de la luz, y a su vez el segundo se define en términos de una propiedad física 
del átomo de kriptón; antiguamente el metro se definía como la longitud del 
patrón de platino que se hallaba en París. En cualquier caso, si alguien quiere 
construir un metro con precisión se ve obligado a observar átomos de kriptón, 
a viajar a París o algo similar. En cambio, no es necesario viajar a París para 
construir un ángulo recto, o un radián, o un grado sexagesimal con precisión. 
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Podría haber un ángulo patrón en París, pero no es necesario porque existen 
unidades naturales de ángulo, en el sentido de que pueden definirse por medios 
puramente geométricos. Nosotros hemos definido el radián y no hemos tenido 
que aludir a ningún átomo. 

Esta asimetría no se da en las geometrías no euclídeas. Pensemos por ejemplo 
en la geometría elíptica. Los segmentos pueden medirse también en radianes, o 
en rectos, o en grados sexagesimales. Una longitud de un recto es simplemente 
la mitad de la longitud de una recta cualquiera. Una longitud de un radián 
es simplemente 2/n rectos. Desde un punto de vista más conceptual, esto se 
refleja en que la geometría euclídea tiene semejanzas que no son isometrías (apli- 
caciones que conservan ángulos pero no longitudes, de modo que dos segmentos 
cualesquiera son semejantes), mientras que en las geometrías no euclídeas todas 
las semejanzas son isometrías. 

La ausencia de unidades naturales de longitud (o la presencia de semejanzas) 
hace que la geometría euclídea sea invariante a escala. La geometría de Liliput 
es exactamente la misma que la nuestra, y así sería aunque los liliputienses 
midieran una millonésima de milímetro. No habría ningún argumento objetivo 
para concluir que ellos son "pequeños" y nosotros "grandes" o "normales". Las 
nociones de "grande" y "pequeño" son relativas a la unidad de medida, y ésta es 
arbitraria. No ocurre lo mismo en las geometrías no euclídeas. Supongamos que 
la superficie de la Tierra fuera completamente esférica, sin hoyos ni elevaciones. 
Ahora sí tiene sentido decir que un metro es objetivamente "pequeño", con 
respecto a una unidad natural de longitud, pues un metro es 20 millones de 
veces más pequeño que un meridiano (una recta elíptica) . Quizá el lector piense 
que esta noción de pequeñez no deja de ser subjetiva. Ciertamente no es rigurosa 
en el sentido de que no podemos determinar cuándo una longitud deja de ser 
pequeña, pero es la forma más natural de expresar un hecho objetivo que vamos 
a explicar a continuación. 

Supongamos que trazamos un triángulo en nuestra Tierra perfecta. Digamos 
que uno de sus lados mide un metro. Entonces podemos aplicarle el teorema 
del coseno para un lado, es decir, la fórmula: 

eos a = — eos (3 eos 7 + sen (3 sen 7 eos a. 

Ahora bien, si entendemos que las funciones trigonométricas que aparecen 
son las que hemos estudiado en este capítulo, los ángulos han de estar en ra- 
dianes. Si el lado a mide un metro, su medida en radianes es aproximadamente 
a « 1,6- 1CT 7 , y entonces cosa « 0,9999999999999872. Por consiguiente nuestro 
triángulo cumple 

eos a sa — eos (3 eos 7 + sen (3 sen 7 = — cos(/3 + 7) = cos(7r — (3 — 7) , 

de donde se sigue que a + [3 + j ta ir + 2kir. Como la suma de los ángulos de un 
triángulo elíptico está entre tt y 3tt, concluimos que la suma ha de parecerse a 
7r o a 3ir. Enseguida descartaremos el segundo caso y concluiremos 



a + /3 + 7 « 2tt. 
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Si hacemos cálculos concretos veremos que esta aproximación excede nues- 
tra capacidad de discernimiento, por lo que aparentemente nuestro triángulo 
cumplirá la ley euclídea de que la suma de sus ángulos es igual a n. 

La razón por la que la suma de los ángulos no puede acercarse a 3ir nos la 
da el teorema del coseno para un ángulo: 



eos a — eos b eos c + sen b sen c eos a. 



Si ahora sustituimos cosa « 1, eos b ta 1, eos b ta 1 obtenemos la relación 
sen b sene cosa ta 0, que no expresa más que el hecho de que cuando b y c son 
pequeños sen b ta 0 ta sen c. Vamos a aproximar las razones trigonométricas por 
sus polinomios de Taylor de grado 2 en 0. 

Consideramos grado 2 porque, para el coseno, el polinomio de Taylor de 
grado 1 es también P\{x) = 1, luego estamos en el mismo caso de antes. En 
cambio el de grado 2 nos da la aproximación: 



eos x ta 1 



x 2 



Respecto al seno, el polinomio de grado 1 coincide con el de grado 2. Ambos 
nos dan la aproximación sena; ta x. 

Ejercicio: Comprobar que para a « 1,6 • 1CP 7 el resto del polinomio de Taylor de 
grado 3 (que es el mismo que el de grado 2) del coseno en 0 es menor que 3 ■ 1CP 29 . 
El resto de grado 2 del seno es menor que 7 • 10~ 22 . 



Por consiguiente 



„ b 2 c 2 b 2 c 2 

eos o eos c ta 1 1 . 

2 2 4 



Ésta es una aproximación de cuarto grado. Podemos despreciar el último 
término y quedarnos con 

eos b eos c ta 1 — — — — . 

2 2 

Aunque no hemos definido este concepto, lo cierto es que 1 — x 2 /2~ y 2 /2 es el 
polinomio de Taylor de segundo grado de la función de dos variables eos x eos y. 
Con estas aproximaciones el teorema del coseno se convierte en 

1 a 2 1 b 2 c 2 L 

1 ta 1 y be eos a, 

2 2 2 



o equivalentemente, 



a 2 ta b 2 + c 2 — 26c eos a, 



que es el teorema del coseno euclídeo. Esto significa que los ángulos de nuestro 
triángulo serán aproximadamente los mismos que los del triángulo euclídeo de 
lados a, b, c, luego su suma se parecerá a ir y no a 3ir. 
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En general, todas las fórmulas de la geometría elíptica aproximan a fórmulas 
cuclídeas cuando las longitudes involucradas son pequeñas. La aproximación 
sena; « x transforma el teorema de los senos elíptico en el correspondiente 
euclídeo. 

Ejercicio: Comprobar que el teorema de Pitágoras elíptico: cosa = eos o cose se 
convierte aproximadamente en el euclídeo para triángulos pequeños. 

Resulta así que la geometría elíptica a gran escala es muy diferente de la geo- 
metría elíptica a pequeña escala, pues ésta última es aproximadamente euclídea. 
Esto se expresa diciendo que la geometría elíptica es localmente euclídea. La 
interpretación geométrica es clara: la geometría elíptica es localmente igual a la 
geometría de una esfera, y la geometría de una esfera se aproxima localmente a 
la de cualquiera de sus planos tangentes, que es euclídea. 

Todo lo dicho vale igualmente para la geometría hiperbólica. En primer 
lugar hemos de observar que también en esta geometría hay unidades naturales 
de longitud, definibles geométricamente. Por ejemplo, si un triángulo equilátero 
tiene todos sus lados unitarios, el teorema del coseno nos permite calcular sus 
ángulos. Todos miden 

e 2 + l 

a = arceos -= sa 0,92 rad. 

e 2 + 2e + 1 

Por lo tanto podemos definir la unidad de longitud hiperbólica como la 
longitud del lado del triángulo equilátero cuyos ángulos miden a. La selección 
de esta unidad de longitud se lleva a cabo en el momento en que definimos la 
distancia entre dos puntos mediante la fórmula 

d{P,Q) = \ IogK(P,Q,Qoo,-Poo). 

Si cambiamos la base del logaritmo o si cambiamos la constante 1/2 estamos 
cambiando de unidad de longitud (ambos cambios son equivalentes). 

Para transformar las fórmulas hiperbólicas en fórmulas euclídeas basta usar 
las aproximaciones de Taylor: 

x 2 

senhx sa x, coshx sa 1 + — . 
Dejamos los detalles a cargo del lector. ■ 



3.9 Primitivas 

El teorema 3.16 afirma que una función derivable está completamente de- 
terminada por su derivada y su valor en un punto. A menudo se plantea el 
problema práctico de determinar una función a partir de estos datos. 

Definición 3.39 Diremos que una función F : I — > IR definida en un intervalo 
abierto / es una primitiva de una función / : / — > R si F es derivable en I y 
F' = f. 
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No estamos en condiciones de decir mucho sobre cuándo una función tiene 
primitiva. Nos limitaremos a hacer algunas observaciones teóricas que en casos 
concretos nos permitirán encontrar primitivas de funciones dadas. En estos 
términos, lo que afirma el teorema 3.16 es que si una función / admite una 
primitiva F, entonces el conjunto de todas las primitivas de / está formado por 
las funciones de la forma F + c, para cada c G IR. Esto hace que, aunque F no 
esté unívocamente determinada por /, dados a, b £ I, el incremento F(b) — F(á) 
sí lo está. Conviene introducir la notación 

[F(x)] b a = F(b)-F(a). 

En el lenguaje del cálculo infinitesimal, si sabemos que dy = f(x)dx, esto 
significa que la función y experimenta un incremento infinitesimal de f(x)dx 
cada vez que la variable se incrementa en dx. Supongamos que y está definida 
en [a, b] y conocemos y (a). Entonces y(b) ~ y (a) + f(a)(b — a). En realidad 
éste es el valor que toma en b la recta tangente a y en a. Obtendremos una 
aproximación mejor si dividimos el intervalo [a, b] en partes iguales, digamos 
a = x 0 < x\ < ■ ■ ■ < x n = b, todas de longitud Ax, y vamos calculando: 

y(xo) = y(a), 

V(xi) ~ f(x 0 )Ax + y(a), 

y(x 2 ) « /(x 0 )Ax + /(xi)Ax + y(a), 



En definitiva, 

n 

y(b)-y(a)^Y,f( x ^ Ax 

i=i 

La aproximación será mejor cuantas más partes consideremos, es decir, 
cuanto menor sea Ax. Así, el incremento de la primitiva puede pensarse como 
una suma de infinitos sumandos correspondientes a un incremento infinitesimal 
dx. Por ello la notación clásica para el incremento de una primitiva F de una 
función /(x) en un intervalo [a, b] es 

f f(x)dx=[F(x)] b a (3.6) 

Ja 

donde el símbolo proviene de una S de "suma" (en realidad del latín summd) 
y se lee integral de la función / respecto a x en [a, b) (porque es el incremento 
"entero" que se obtiene al sumar sus incrementos infinitesimales). Los números 
a y b se llaman limites de la integral. Para convertir al cálculo integral en una 
teoría matemática eficaz es necesario tener en cuenta estas ideas y tratarlas 
con rigor, pero de momento no vamos a entrar en ello y vamos a limitarnos a 
considerar la integración como la operación inversa a la derivación. Así pues, 
tomamos (3.6) como definición de la integral de /. Notemos que si dejamos el 
límite superior como variable obtenemos una primitiva concreta G de /, a saber, 
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la única que cumple G(a) = 0: 

G(t)= í f(x)dx = F(x)-F(a). 

J a 

Cuando queremos referirnos a una primitiva arbitraria de una función usa- 
mos esta misma notación integral, pero omitimos los límites de integración, así, 



/ 



f(x) dx = F(x) + c, donde c G 



Veremos que esta notación es consistente con los otros usos que venimos 
haciendo de los símbolos dx. De la propia definición de primitiva se sigue que 



/- 



y'(x) dx = y(x) + c. 
Con la notación dy = y' dx esto se escribe así: 

dy = y + c. 



Cada regla de derivación da lugar a una regla de integración. Por ejemplo, 
el hecho de que la derivada de una suma es la suma de las derivadas implica 
que una suma tiene por primitiva a la suma de las primitivas. Más en general, 
dadas dos funciones u, v, 

I ' (au + (3v) dx = a J udx + [i j vdx, para a,/5€ R. 

Uniendo esto a la regla evidente: 

-i 

+ c, -1, 



n + 1 

podemos integrar cualquier polinomio. El caso exceptuado es claro: 

x^ 1 dx = logx + c. 



I' 



La regla de derivación del producto requiere más atención: dadas dos funcio- 
nes derivables u y v tenemos que d(uv) = udv + vdu, luego integrando tenemos 



j udv = uv — J v du. 



Esta fórmula se conoce como "regla de integración por partes" . Obviamente 
de aquí se sigue a su vez la versión con límites: 



I udv=[uv] b a — / vdu. 

Ja Ja 
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Ejemplo Vamos a calcular J xe x dx. Para ello llamamos u = x y dv = e x dx. 
Claramente entonces du = dx y v = J dv = J e x dx = e x . La fórmula anterior 
nos da 



J xe x dx = xe x - J 



e x dx = xe x - e x + c. 



Observar que hemos omitido la constante al calcular v — e x . Es claro que para 
aplicar la regla podemos tomar como v una primitiva fija cualquiera. ■ 

Ejemplo Sea I m , n = J sen™ x eos" x dx. Vamos a encontrar unas expresiones 
recurrentes que nos permitan calcular estas integrales. Integramos por partes 
tomando u = eos" -1 x, dv = sen™ x eos x dx. De este modo: 

sen m+1 x eos™ -1 x n-l f +1 „_ 2 

l mn = 1 / sen T x eos x sen x dx 

m + 1 m + 1 



gen m+i x cog n x n-\ r 

1 / sen xcos sil— eos x) dx 

m + 1 m + 1 J 

sen m+1 x eos™ -1 x n—1 



m + 1 m + 1 

Despejando llegamos a 



sen m+1 xcos" 1 x n — 1 

m + n m + n 

Similarmente se prueba 

sen" 1-1 xcos" +1 x m — 1 

m+n m+n 

Estas fórmulas reducen el cálculo de cualquier integral I m ^ n al cálculo de las 
cuatro integrales 



j dx, j senxdx, j cosxdx, j 



senxdx, J cosxdx, J senxcosxdx, 

y todas ellas son inmediatas (para la última aplicamos la fórmula del seno del 
ángulo doble). ■ 

Por último veamos en qué se traduce la regla de la cadena. Supongamos 
que tenemos una integral J u(x) dx, que F(x) es una primitiva de u(x) (la que 
queremos calcular) y que x = x(t) es una función derivable con derivada no nula 
(que por consiguiente tiene inversa derivable t = t(x)). Entonces por la regla 
de la cadena F(x(t))' = F'(x(t)) x'(t) = u(x(t))x'(t), luego 



/ 



u(x(t)) x'(t) dt = F(x(t)) + c. 



Así pues, para calcular J u(x) dx podemos sustituir x por x(t) y dx por x'(t) dt y 
calcular una primitiva G{t) de la función resultante, ésta será F(x(t)) + c, luego 
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si sustituimos G(t(x)) — F(x(t(x))) + c= F(x) + c, obtenemos una primitiva de 
la función original. A esta técnica se la llama integración por sustitución. La 
versión con límites es: 



r t(D) r 0 

/ u(x(t))x'(t) dt = F(x(t(b))) — F(x(t(a))) = F(b) - F(a) = / u(x) dx, 

Jt(a) Ja 

sea: 

I u{x)dx = I u{x(t)) x (t) dt. 

Ja Jtía) 



Ejemplo Vamos a calcular J Vi — x 2 dx. El integrando está definido en el 
intervalo ] — 1,1[. Consideramos la función x = sení, definida y biyectiva en 
]0, 7r[. Entonces dx — cosí dt y se cumple 

J \J\ — x 2 dx = j \/l — sen 2 t eos t dt = j eos 2 tdt = j - — ^ dt 

1 f , 1 l\ n , t 1 ti 

= - dt + - 2 eos 2t dt = - + - sen 2t + c= - + - sen t eos t + c 

2 J 4 J 24 22 



aresen x . x\Jl — x 2 



+ ^ +c. 



En general, si la primitiva de una función en un intervalo ]a, b[ se extiende 
continuamente al intervalo [a, b], dicha extensión es obviamente única, por lo 
que podemos calcular la integral desde a hasta b, que se interpreta como el 
incremento completo de la primitiva. Así, en el ejemplo anterior tenemos 



\fl — x 2 dx = —. 



3.10 Apéndice: La trascendencia de e y 7r 

Para acabar el capítulo probaremos que las constantes e y w que nos han 
aparecido son números trascendentes (sobre Q) . Supondremos al lector familia- 
rizado con la teoría de números algebraicos. Aunque es muy sencillo probar que 
casi todos los números reales son trascendentes, pues el conjunto de números 
algebraicos es numerable y IR no lo es. No es fácil, en cambio, probar la tras- 
cendencia de un número particular. Hermite fue el primero en demostrar la 
trascendencia de e y Lindemann probó después la de n. Aquí veremos unas 
pruebas más sencillas, pero hay que señalar que la prueba de Lindemann se ge- 
neraliza a un teorema más potente, en virtud del cual los valores que toman las 
funciones senx, cosx, e x , loga;, etc. sobre números algebraicos son — salvo los 
casos triviales — números trascendentes. Por ello a estas funciones se les llama 
también funciones trascendentes. 
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Comenzamos introduciendo unos convenios útiles de notación: 

m 

Definición 3.40 Escribiremos h r = r!, de modo que si f(z) = Yl c rZ r € C[z], 
entonces f(h) representará 



c r r\ 



Igualmente, f(z + h) será el polinomio que resulta de sustituir y r por h r = rl 
en la expresión desarrollada de f(z + y). Concretamente: 

m m r , , m / m , v \ 

/(, +») = E c r( 2; +y) r = E c -E u ) ^ V = E EJ ^ y\ 

r=0 r=Q k=0 ^ ' fc=0 \r=fc ^ ' / 

luego 

m ( m ír\ \ m ( m r \ \ m 

f(z+h) = j2[J2 c r () ^ k V = E E T^jí ^ fe =E/ fe) (*) - 

fc=0 \r=fc V 7 / k=0 \r=k y >' / k=0 

donde f k \z) es la fc-ésima derivada formal del polinomio /. Observar que 

m 

f( z + h) = Y,cAz + hy, 

pues 

£ Cr (z + />r = E^E( zr ) fe) = E E c ^ r 

r=0 r=0 fc=0 fc=0 \r=0 / 

m 

= ^/ fc )(z) = /(z + / l ). 

k=0 

Así mismo, 

m m 

/(0 + /i) = £/ fe )(0)=£c r r! = /(/i). 

fe=0 r=0 

Sea 



oo 

Z" 

U r 



,(z)=r\J2 



' (r + n)!' 

n=l v ' 

Teniendo en cuenta que 



zl lz| 
ñ! 



('■+")! < n! 



es claro que la serie converge en todo C y que |w r (z)| < e' 2 '. Llamaremos 
Así, \e r (z) \ < 1. 
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Teorema 3.41 Sea <fi(z) = c r zT <= C[z]. Sea tp(z) = c r e r (z)z r . Enton- 
ees 

e z 4>{h) = (j)(z + h) + V>(z)e |z| . 
Demostración: En primer lugar 

fc=0 v 7 fc=0 fc=0 

y por otro lado 

oot, oo ~ oo¿, oo¿, 

& % 2¿ ' 

r\e z -u Á z V = H^ ¥ -H^ (? ^ ! ^ = H^ ¥ -r! £ 

1=1 v y fc=0 fc=r+l 



= r'V- 

fc=0 



o sea, (z + /i) r = He z — u r (z)z r , y por lo tanto 

e z h r = (z + h) r + u r (z)z r = (z + h) r + e lzl e r (z)z r . 
Multiplicando por c r y sumando en r obtenemos la igualdad buscada. ■ 

Teorema 3.42 Sea m > 2 y f(x) € Z[x]. Definimos los polinomios F\ y F 2 
mediante: 

T m— 1 T m 

Fi(x) = -/(x), F 2 (x) = -f(x). 

(m — 1)! (m — 1)! 

Entonces F^h), F 2 (h) € Z, íi(/i) = /(O) (mód m) y F 2 (/i) = 0 (mód m). 

r 

Demostración: Sea f(x) = a r x r , con a r e Z. Entonces 

í=í ("»-!)! ¿=¡J (m-1)! 

y m divide a cada sumando excepto quizá al primero, que es ao = /(O). Por lo 
tanto F\(h) = /(O) (mód ra). Con i<2 se razona análogamente. ■ 

Como último preliminar recordemos que p{x\ 1 . . . , x n ) £ A[iri, . . . , x n ] es un 
polinomio simétrico si para toda permutación a de las variables se cumple que 
p(xi, . . . ,x n ) = p(cr(xi), . . . , cr(x n )). Los polinomios simétricos elementales de 
n variables son los polinomios eo, . . . , e„ tales que e¿ es la suma de todos los mo- 
nomios posibles formados por i variables distintas. Por ejemplo, los polinomios 
simétricos elementales de tres variables son 

e 0 = 1, e x = x + y + z, e 2 = xy + xz + yz, e 3 = xyz. 

Vamos a usar los dos resultados siguientes sobre polinomios elementales: 
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Todo polinomio simétrico p(x\, . . . , x n ) es de la forma q(e\, . . . , e„), 
para cierto polinomio q(xi, . . . ,x n ). 

Los coeficientes (x — ai) ■ ■ ■ (x — a n ) son (— l) l e¿(ai, . . . , a n ), para 



i = O, . . . , n. 



Teorema 3.43 El número e es trascendente. 



Demostración: Si e fuera algebraico sería la raíz de un polinomio con 

n 

coeficientes enteros. Digamos c t e * = 0> con n > 1, c t & I*, c 0 ^ 0 (si c 0 

fuera 0 podríamos dividir entre e y quedarnos con un polinomio menor). 
Sea p un primo tal que p > n y p > \co\. Sea 

m = ^^((*-l)(^-2)'--(^)) P . 
Por el teorema 3.41: 

n n n 

0 = Y, cte*4>(h) = ]T ct4>(t +h) + Y cMty = S 1 + S 2 . 
t=o í=0 í=0 

Tomando m = p, el teorema 3.42 nos da que 4>(h) £ Z y 

tf>(h) = (-iy n (n\) p (mód p). 
Si 1 <t<n, entonces 

4>{t + x)= ^T^| ((x + t-l)(x + t-2)---x---(x + t- n)) P , 

y sacando el factor x queda 

con f(x) G Jj[x}. Por el teorema 3.42 tenemos que 4>(t+h) G Z y es un múltiplo 
de p. Ahora, 

n 

Si = Y ctíd + h ) = c ^ h ) = ^(-l) pn (n\y ± 0 (mód p), 
t=o 

ya que c 0 ^ 0 y p > n, \c 0 \. Así pues, 5i £ Z y Si ^ 0, luego |Si| > 1. Como 
Si + S2 = 0, lo mismo vale para S2, es decir, IS2I > 1. Por otro lado, sea 

s 

<f>(x) = a rX r . Entonces 

r=0 



\m\ 



a r e r (t)t r 



r=0 



<¿|a r ||e r (t)|t r <¿|a I .|t'-. 

r=0 r=0 



152 



Capítulo 3. Cálculo diferencial de una variable 



Observemos que \a r \ es el coeficiente de grado r del polinomio 

xP- 1 



(P 



— ((x + l)---(x + n)) p . 



Basta ver que si &¿ es el coeficiente de grado i de ((x — 1) • • • {x — n)) P , 
entonces |6¿| es el coeficiente de grado ¿de Ux + 1) • • • (x + n)) p , pero 

N = | (-l)^-*^-^!, 1, ...,«) | 

= (-l)f«-' e „ p _ ¿ (-l, .... n I -n). 

Por lo tanto podemos concluir: 

\m\ < E W\t r = t£^t((í + 1)(* + 2) ■ ■ ■ (t + n)) P , 
y en definitiva: 

(í(í+l)---(í + n)) P ~ 1 



< (í + l)(í+2)---(í + n)- 



(p-1)! 



Pero esta expresión tiende a 0 cuando p tiende a infinito (por la convergencia 
de la serie de la función exponencial) . En consecuencia, tomando p suficiente- 

n 

mente grande podemos exigir que S 2 = J2 CtVK*) 6 ' cumpla IS2I < 1, cuando 

t=o 

hemos demostrado lo contrario para todo p. Esto prueba que e es trascendente. 



La trascendencia de ir es algo mas complicada de probar. Además de los 
teoremas 3.41 y 3.42 necesitaremos otro resultado auxiliar: 

Teorema 3.44 Sea p(x) = dx m + dix" 1 ^ 1 + • • • + d m -\x + d m € Z[x], sean 
a\, ... , a m sus raíces en C y sea q{x\, . . . , x m ) G 1\x\, . . . , x m ] un polinomio 
simétrico. Entonces q{da\ 1 . . . , da m ) € Z. 

Demostración: Claramente 

d^pix) = (dx) m + d 1 (dx) m - 1 +dd 2 (dx) m - 2 + --- + d m - 2 d m - 1 (dx) + d m - 1 d m . 

O sea, d rn ~ 1 p(x) = r(dx), donde 

r(x) = x m + d x x m - x + dd 2 x" 1 - 2 + ■■■ + d^d^x + (f"" 1 d m € Z[x] 

es un polinomio mónico y sus raíces son obviamente da\,...,da m . Conse- 
cuentemente, r(x) = (x — do¿i) ■ ■ ■ (x — da, n ) y los coeficientes de r(x) son 
( — l) l e¿(cfai, . . . , da m ) para i = 0, . . . m. Así pues, a(dai, . . . , da m ) G Z para 
i = 1, . . . ,m. 

Por otro lado sabemos que q{x\, . . . , x m ) — r(e\, . . . , e m ) para cierto polino- 
mio r(x 1 , . . .,x m ) e 1[xi, . . .,x m ], luego 

q(dai, . . . , da m ) = r(e\{dai, . . . ,da m ), . . . , e m (dai, . . . ,da m )) € Z. 
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Teorema 3.45 El número ir es trascendente. 

DEMOSTRACIÓN: Si n es algebraico también lo es iir. Sea 

dx m + d 1 x m ^ 1 H h d m _ia; + d m £ Z[x] 

un polinomio tal que d ^ 0 y con raíz Mr. Sean wi, . . . ,u; m sus raíces en C. 
Como una de ellas es iir y e l7T + 1 = 0, tenemos que (1 + e" 1 ) • • • (1 + e Um) = 0, 
o sea, 

2 m -l 

1 + E gat = °> 
í=i 

donde ai, ... , a 2 ™_i son wi, . . . , u) m , ui + w 2 , • • • , w m -i +^ m , . . . , Ui + ■ ■ ■ +Lü m . 

Supongamos que c — 1 de ellos son nulos y n = 2 m — 1 — (c — 1) no son nulos. 
Ordenémoslos como ai, ... , a n , 0, . . . , 0. Así c > 1 y 

n 

c+^e at =0. (3.7) 
t=i 

Notemos lo siguiente: 

j • • • 5 ^n) (^1 , • • • , ^n, 0, . . . , 0) , 

donde e¿ es a la izquierda el polinomio simétrico elemental de n variables y a la 
derecha el de 2 m — 1 variables. Por lo tanto 

e»(dai, ■ • ■ , da n ) = e¿(dai, . . . , da 2 m_i) 

= ei(dui, . . . , dw m , dwi + duj 2 , . . . , dw m -i + ^m, • • • , dwi + h dw m ). 

Sea ^ 1 , • • - , <Ern) (<^1 ) * • • 3 %m > ^1 ~\~%2 ? • • * ; ^m— l~\~^m , • • * , «£l "I - * ' ,- t - ^'m) ■ 

Claramente se trata de polinomios simétricos con coeficientes enteros y 

e¿(dai, . . . , da n ) = qi(du>i, . . . , dw m ), 

luego el teorema anterior nos permite afirmar que e¿(dai, . . . , da n ) € Z. 

Si s(xi, . . . , x„) <E Z[xi, . . . , x n ] es simétrico, entonces s depende polinómi- 
camente de los e¿, luego s(dai, . . . , da„) G Z. Sea p un primo tal que p > \d\, 
p > c, p > \d n ai ■ ■ ■ a n \. Sea 

d np+p ~ 1 x p ~ 1 

^ = ( p - 1)1 ^ X - "l) • • ' - «n)) ■ 

Multiplicamos (3.7) por </>(/i) y aplicamos el teorema 3.41. Nos queda 

n n 

c<t>{h) + ]T 0(a t + /i) + X] V>Me |Qt| = S 0 + Si + S 2 = 0. 
t=i t=i 

Ahora, 

</>(x) = -; — d p ~ 1 ((dx — da\) ■ ■ ■ (dx — da n )) p . 
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Los coeficientes de (y — do¿i) ■ ■ ■ (y — da n ) son polinomios simétricos elemen- 
tales sobre da\, . . . 7 da n , luego son enteros, según hemos visto antes. De aquí 
se sigue que también son enteros los coeficientes de (dx — da\) ■ ■ ■ (dx — da n ), 
con lo que 

ü-i n P 
x ^ — ~v 

(f>(x) = — 2_^9rX r , donde cada g r E Z. 

W >' r=0 

Por el teorema 3.42 tenemos que <j>(h) eZy cp(h) = go (mód p). Concre- 
tamente, go = (— l) pn d p ~ 1 (do¿i ■ ■ ■ da n ) p , luego por la elección de p resulta que 
p \ go (aquí es importante que da± ■ ■ ■ da n € Z porque es el término indepen- 
diente de (y — dot\) ■ ■ ■ (y — dct n ). Como p \ c, resulta que p] S 0 = ccp(h). 

Nos ocupamos ahora de S\ . Tenemos que 

. d n P+P- 1 (a t + x)P- 1 .. , , 

<p{a t + x) = ^ _ j-yj ({x + a t -a- í )---(x + a t - a t _i) 

x(x + a t - cüí+i) ■■■(x + ctt- a n )) p 

x p 

= — — d p (da t + dx) p ~ 1 ((dx + da t — do¿\) ■ ■ ■ (dx + da t — da t -\) 



(dx + dat — da t +i) ■ ■ ■ (dx + da t — da n )) P 

x p 

Jp^íy. 



np—1 

E f rtX ^ 

r=0 



donde f rt = f r (da t ,dai, . . . , da t -i, da t+ i, . . . , da n ) y f r es un polinomio simé- 
trico respecto a todas las variables excepto la primera, con coeficientes enteros 
y que no depende de t. En efecto, consideramos el polinomio 

{y-(-x 1 )) p l ((y- (x 2 -xi)) ■ ■■ ((y- (x n - a;i))) • 

Sus coeficientes son los polinomios simétricos elementales actuando sobre —X\ 
(p-1 veces) y sobre (p veces cada uno) , luego son polinomios 

np— 1 

simétricos en x 2 , ■ ■ ■ ,x n . Digamos que el polinomio es s r( x i 1 ■ ■ ■ > x n )y r . 

r=0 

Entonces 

r¡ np-1 
X' v — > 

+ x)= } j d p s r (da t , dai, . . . , da t -\, da t+ i, ■ ■ ■ , da n )d r x r , 

es decir, f r = d r+p s r (x\, . . . , x n ). Por lo tanto, 

np— 1 / n 



E^+') = P)íE E¿ 

í=l yF >' r=0 \í=l 



rt X 
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pero 

n n 

y^/rt = ^ frjdat, dai, da t -i, da t+ i, ■ ■ ■ , da n ), 
1=1 t=i 

n 

y el polinomio ^ f r (xt, xi, . . . , Xt—i, Xt+i, ■ ■ ■ x n ) es simétrico (respecto a todas 
t=i " 

las variables), luego F r = Y] frt depende simétricamente de dot\,..., da n y por 

t=i 

lo tanto es un entero. Así pues, 



p np—1 



y por el teorema 3.42 concluimos que Si = 4>{ctt + h) € Z y es múltiplo de p 

t=i 

(aquí hemos usado que (0i + (f>2)(h) = 4>i{h) + <¡>2{h), lo cual es evidente). 

Esto nos da que £0 + Si € Z y no es un múltiplo de p. En particular 
|So + Si | > 1 y, por la ecuación So + Si + S2 = 0 resulta que también S2 € Z y 
IS2I > 1. Como en el caso de e, ahora probaremos lo contrario. 

np+p— 1 

Sea ip(x) = c r e r (x)x r . Entonces 



r=0 



np+p— 1 



r=0 



np+p— 1 



r=ü 



I J|rap+p-l| r |p-l 

^ (n _\\t m + M---(\x\ + \a n \)Y 



(p-iy. 

(por el mismo razonamiento que en la prueba de la trascendencia de e) y así 

j^-2np+2p-2 

donde M es una cota que no depende de p. 

Como M 2 "p+ 2 p- 2 < M 2 "P+ 2 P = Af( 2 ™+ 2 )P = .K? = KK?- 1 , tenemos que 

K p-i 



(x)\<K 



(P-1)1 



y la sucesión converge a 0 cuanto p tiende a infinito, pues la serie converge 
a Ke K . Esto para cada x fijo. Tomando un primo p suficientemente grande 

n 

podemos exigir que |S 2 | < IVK^*)! 6 '"*' < 1; con 1° q ue llegamos a una con- 
tri 

tradicción. ■ 



Capítulo IV 



Cálculo diferencial de varias 
variables 

Este capítulo está dedicado a generalizar a funciones de varias variables las 
ideas que introdujimos en el capítulo anterior. Básicamente se trata de estudiar 
cómo varía una función de varias variables cuando incrementamos éstas infinitc- 
simalmente. Más concretamente estudiaremos una función / : A C M. n — ► R m , 
donde A es un abierto, aunque a efectos de interpretar la teoría nos centraremos 
de momento en el caso en que m = 1 . 

4.1 Diferenciación 

Pensemos por ejemplo en una función / : M 2 — > IR. Mientras una función de 
una variable derivable en un punto tiene asociada una única recta tangente que 
la aproxima, una función de dos variables tiene (o puede tener) una tangente 
distinta para cada dirección. La figura muestra (a la izquierda) una tangente a 
la gráfica de / en un punto, y a la derecha vemos varias tangentes distintas en 
ese mismo punto. 




Intuitivamente está claro qué es la recta tangente a una superficie en un 
punto y en una dirección. Ahora vamos a caracterizar matemáticamente este 
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concepto. Tenemos un punto a € IR" y una recta que pasa por a. Ésta queda 
determinada por un vector v € K™ no nulo. Podemos suponer \\v\\ = 1 (mientras 
no se indique lo contrario, todas las normas que consideraremos serán euclídeas). 
Los puntos de la recta son los de la forma a+hv, con h EM.. Más concretamente, 
el punto a + hv es el que se encuentra a una distancia \h\ de a sobre dicha recta 
(el signo de h distingue los dos puntos en estas condiciones). 

Buscamos una recta que se parece a la gráfica de / alrededor del punto a. 
Si la gráfica fuera rectilínea en la dirección considerada, su pendiente vendría 
dada por 

f(a+hv)-f(a) 
h 

para cualquier h ^ 0. Si no es así, entonces esta expresión se parecerá más a 
la pendiente que buscamos cuanto menor sea h. Ello nos lleva a la definición 
siguiente: 

Definición 4.1 Dada una función / : A C K™ — > M. m definida en un abierto, 
un punto a € A y un vector d e 1" no nulo, llamaremos derivada direccional 
de / en a y en la dirección de v al vector 

/>;,)= Km /(a+ ^- /(a) g R- 
v ; h-o h 

Es fácil ver que si existe f'(a;v) entonces existe f'(a;Xv) = Xf'(a,v) para 
todo A € R \ {0}. Por lo tanto no perdemos generalidad si suponemos ||u|| = 1. 
Si existe /'(a; v), para valores pequeños de h tenemos la aproximación 

f(a + hv)f*f(a)+hf'(a;v), 

con lo que la expresión hf'(a; v) aproxima el incremento que experimenta /(a) 
cuando la variable se incrementa h unidades en la dirección de v. 

En el caso m = 1 la función a + hv f(a) + hf'(a; v) se llama recta tangente 
a la gráfica de / en a. Es claro que se trata de la recta que pretendíamos 
caracterizar. 

Como en el caso de una variable, si una función / : i C R" — > K™ admite 
derivada direccional en la dirección de v y en todo punto de A, entonces tenemos 
definida una función 

/'( ;v) : A — > IR m . 

Respecto al cálculo de derivadas direccionales, las propiedades de los límites 
nos dan en primer lugar que si f(x) = (/i(x), . . . , f m (x)), entonces 

f'(a;v) = (f[{a;v),...,f m {a;v)), 

entendiendo que la derivada de / existe si y sólo si existen las derivadas de 
todas las funciones coordenadas /¿. Por consiguiente el cálculo de derivadas 
direccionales se reduce al caso de funciones / : A c K" — > R. A su vez éstas 
se reducen al cálculo de derivadas de funciones de una variable. Efectivamente, 
basta considerar la función <f)(h) — f(a + hv). El hecho que que A sea abierto 
implica claramente que <f) está definida en un entorno de 0 y comparando las 
definiciones es claro que /'(a; v) = <j>'(0). 



4.1. Diferen dación 
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Ejemplo Vamos a calcular la derivada de f(x,y) = x 2 y 2 en el punto (2, 1) y 
en la dirección (—1,1). Para ello consideramos 

4>{h) = /(2 -h,\ + h) = {2- h) 2 {\ + hf. 

Entonces <j>'(h) = -2(2 -h)(l + h) 2 + 2(2 - h) 2 (í + h) y ^(0) =4. ■ 

Existen unas derivadas direccionales especialmente simples de calcular y es- 
pecialmente importantes en la teoría. Se trata de las derivadas en las direcciones 
de la base canónica de R n . 

Definición 4.2 Sea / : A C IR™ — > M. m una función definida en un abierto y 
a € A. Se define la derivada parcial de / respecto a la i-ésima variable en el 
punto a como 

A/(a) = ^(o) = / , (o;e i ), 
donde e¿ = (0, . . . , 1, . . . , 0) es el vector con un 1 en la posición z-ésima. 
Explícit amenté : 

D t f(a) = Km /K ■•-,* + V ■• ,"n) ~ /W 

h— >0 íl 

luego si /i es pequeño 

/(ai, . ..,a¿ + ...,a„) « /(a) + hD l f(a). 

En otras palabras, la expresión hDif(a) aproxima el incremento que experi- 
menta f(a) cuando incrementamos h unidades la variable x¿. 

Si / admite derivada parcial ¿-ésima en todos los puntos de A entonces 
tenemos definida la función D¿/ : A — > M. m . 

El cálculo de las derivadas parciales de una función / : A C K™ — > K 
es mucho más simple que el de las derivadas direccionales en general, pues 
podemos considerar la función <j>(xi) = /(ai, . . . , x¿, . . . , a n ) y entonces es claro 
que Dif(a) = 0'(a¿). Notar que si / es una función de una variable, entonces 
</> = /, luego la derivada parcial respecto de la única variable coincide con la 
derivada de / en el sentido del capítulo anterior. Un poco más en general, si 
/ : A C K — > R m llamaremos también derivada de / a su única derivada 
parcial en un punto a, y la representaremos también por f'(a). 

Ejemplo Las derivadas parciales de la función f(x,y) = x 2 y 3 son 

dx ~ ¿XV ' dy ~ 6 V ■ 

En efecto, para calcular la parcial respecto de x en un punto (xo,yo) hay 
que derivar la función x x 2 y^ en x 0 . La derivada es obviamente 2x 0 yo- En 
la práctica podemos ahorrarnos los subíndices: para derivar x 2 y 3 respecto de x 
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basta considerar a y como una constante (la segunda coordenada del punto en 
que derivamos) y derivar respecto de x. Lo mismo vale para y. m 

Es claro que todas las reglas de derivación de funciones de una variable 
pueden ser usadas en el cálculo de derivadas parciales. 

Ejercicio: Sean dos funciones derivables f,g:IcM. — > K n . Probar la regla de 
derivación (/<?)' = f'g + fg'. Si n = 3 se cumple también (/ A g)' = f A g + f A g' . 

El hecho de que una función admita derivadas direccionales en un punto no 
puede ser equiparado a la derivabilidad de una función de una variable. Por 
ejemplo, la existencia de derivadas direccionales no implica siquiera la conti- 
nuidad de la función en el punto. La generalización adecuada del concepto de 
función derivable es el concepto de "función diferenciable" , que vamos a intro- 
ducir ahora. 

Recordemos que si una función de una variable / tiene derivada en un 
punto a, entonces podemos definir su diferencial en a, que es una aplicación 
lineal df{a) : IR — > IR con la propiedad de que /(a) + df(a)(x — a) es una recta 
que "se confunde" con / alrededor de a. Una función de varias variables será 
diferenciable cuando exista una aplicación lineal que juegue un papel análogo: 

Definición 4.3 Sea / : A C IR™ — > IR" 1 una función definida en un abierto A. 
Sea a € A. Diremos que / es diferenciable en A si existe una aplicación lineal 
(j) : IR™ — > R m tal que 

lím /(a + ,)-/(q)-^) =0 

v->0 \\v\\ 

Para analizar esta definición conviene comenzar probando lo siguiente: 

Teorema 4.4 Sea f : A C R™ — > W n una función diferenciable en un punto 
a £ A. Sea (f) : W 1 — > W 11 una aplicación lineal que cumpla la definición 
anterior. Entonces, para cada vector v € IR™ no nulo existe f'(a;v) y además 
4>{v) = f'(a;v). 

DEMOSTRACIÓN: Obviamente hv tiende a 0 cuando h tiende a 0. Por lo 
tanto, restringiendo el límite de la definición de diferenciabildad concluimos que 

lím f(a + hv)-f(a)-^hv) = Q 
h->0 ||ftv|| 

Usando que <j> y la norma son lineales vemos que 

1 ffía + hv) - fía) h ,. ,\ n 

lím — 7~r~, J — - jtMv) = 0. 

h^o \\v\\ \ \h\ |/i| / 

Claramente podemos eliminar el factor l/||w|| sin que el límite varíe. Ahora 
multiplicamos por la función IR \ {0} — > {ü} dada por h \h\/h y usamos 
que el producto de una función que tiende a 0 por otra acotada tiende a 0: 

lím /(" + H-/W _ m = Q 
h->0 h 
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Por lo tanto existe 



f(a + hv)-f(á) 

f (a; v) = hm = <f>(v). 

h—fO n 



En particular vemos que si / es diferenciable en a existe una única aplicación 
lineal <p que cumple la definición de diferenciabilidad, a saber, la dada por 
4>(v) = f(a;v). 

Definición 4.5 Sea / : A C IR" — > M™ una función diferenciable en un punto 
a 6 A. Llamaremos diferencial de / en a a la única aplicación lineal, represen- 
tada por df(a) : R n — > ]R m , que cumple 

Km f(a + v)-f(a)-df(a)(v) = Q 
v^a \\v\\ 

El teorema anterior afirma que para todo v <G R" \ {0} se cumple 

df(a)(v) = f'(a;v). 

Consideremos el caso m = 1. Entonces, para un vector unitario v, la función 

a+hv^ f(a) + df(a)(hv) = f(a) + hdf(a)(v) = f(a) + hf'(a;v) 

es la recta tangente a / por a y en la dirección de v. Cuando h varía en K 
y v varía entre los vectores unitarios, el punto x = a + hv varía en todo IR™ 
y la aplicación x i— » /(a) + df(a)(x — a) recorre todos los puntos de todas las 
rectas tangentes a / por a. Puesto que se trata de una aplicación afín, dichas 
tangentes forman un hiperplano. 

En resumen, hemos probado que para que una aplicación (con m = 1) sea 
diferenciable en un punto a es necesario que tenga rectas tangentes por a en to- 
das las direcciones y que además éstas formen un hiperplano. A este hiperplano 
se le llama hiperplano tangente a la gráfica de / en a. De la propia definición 
de diferencial (haciendo v = x — a) se sigue que para puntos x cercanos a a se 
cumple 

f(x)& f(a) + df(a)(x-a). 

El miembro derecho es precisamente el hiperplano tangente a / en a. Esta 
expresión indica, pues, que dicho hiperplano aproxima a / alrededor de a. 
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La figura de la derecha muestra la gráfica de la función 

f(x,y) = í feí BifryWO.O) 
y) \ O si (*,*/) = (0,0) 

Vemos también cuatro tangentes en (O, 0). Como no se encuentran sobre el 
mismo plano, concluimos que esta función no es diferenciable en (0,0). 

Pasamos ahora al cálculo de la diferencial de una función. Como primeras 
observaciones elementales notamos que si / es lineal entonces df(a) = f y si / 
es constante (alrededor de a) entonces df(a) = 0 (la aplicación nula). Ambos 
hechos se demuestran comprobando que con las elecciones indicadas para <¡> se 
cumple trivialmente la definición de diferencial. 

Para una función f(x) = (/i(a;), . . . , f m (x)), las propiedades de los límites 
nos dan que / es diferenciable en un punto a si y sólo si lo es cada función 
coordenada /¿, y en tal caso 

df(a)(v) = (dh (a) («),..., df m (a)(v)). 

Para determinar df(a) es suficiente conocer su matriz en las bases canónicas 
de IR™ y R m . Dicha matriz tiene por filas las imágenes de los vectores e¿ de la 
base canónica. 

Definición 4.6 Sea / : A C R n — > M. m una función diferenciable en un punto 
se A Llamaremos matriz jacobíana de / en a a la matriz Jf(a) que tiene por 
filas a las derivadas parciales D¿/(a). 

Más concretamente, si f(x) = (/i(a;), . . . , f m (x)), el coeficiente de la fila i, 
columna j de Jf(a) es Difj(a). 

Si ra = 1, se llama vector gradiente de / en a al vector formado por las 
derivadas parciales de / en a. Se representa: 

Vf(a)=(D 1 f(a),...,D n f(a)). 

Si e¿ es el vector z-ésimo de la base canónica, sabemos que 

df(a)(e i ) = f(a;e i ) = D i f(a), 

luego la matriz jacobiana de / es simplemente la matriz de df(a) en las bases 
canónicas de K™ y K m . Así pues, 

df(a)(v)=vJf(a). 

Cuando m = 1, usando el producto escalar en lugar del producto de matrices 
tenemos también 

df(a)(v) = Vf(a)v =^L(a)v 1 + ... + J£(a) v n . 
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Consideremos en particular la función polinómica x¿, es decir, la función 
K™ — > IR dada por (xi, . . . , x„) x¿. Es claro que Vx¿(a) = e¿, luego 
dxi(á)(v) = Vi. Por consiguiente, la ecuación anterior puede escribirse como 

df df 

Como esto es válido para todo v, tenemos la ecuación funcional 

df df 
df(a) = q^W dxi(a) H h i^rW dx n (a). 

Si / : A C K" — > R es diferenciable en todos los puntos de A podemos 
considerar d/, cZxj como funciones de A en el espacio de aplicaciones lineales de 
i" en 1 y la ecuación anterior nos da 

d f Q ' /" 

df = - — dxi H h ~ — dx„. 

OXi dx n 

Esta fórmula expresa que si cada variable experimenta un incremento infi- 
nitesimal dxi entonces la función / experimenta un incremento df de la forma 
que se indica. Como en el caso de una variable, la expresión ha de enten- 
derse en realidad como una igualdad funcional que a cada vector de incrementos 
(Axi, . . . , Ax n ) le asigna una aproximación del incremento A/ que experimenta 
la función. 

Similarmente, en el caso m > 1 tenemos 

df = (df!,..., df m ) = (dx-í, dx n ) Jf. 

Ejemplo Consideremos la función ]0, +oo[ x ]— ir, ir[ — > IR 2 dada por 

x = pcosO, 
y = psen9. 

Podríamos demostrar que es diferenciable aplicando la definición, pero más 
adelante será inmediato (teorema 4.11), así que vamos a aceptar que lo es y 
calcularemos su diferencial. Para ello calculamos la matriz jacobiana: 



J(x,y)(p,0) = 
Por consiguiente 



dx dy 

dp dp I _ I eos 8 sen 9 

dx dy ] y -P sen 9 pcosd 

de d~9 



ÍA A \ ÍA Aü\ ( COSO Sené * 

(dx,dy) = (dp,d9)í^ _ psend pcQs0 

= (eos 9 dp — p sen 9 d9, sen 9dp+ p eos 6 de), 
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o más claramente: 

dx = eos 9dp — p sen 9 d0, 
dy = sen 9 dp + p eos 9 dO. 

También podríamos haber calculado dx y dy de forma independiente. 



4.2 Propiedades de las funciones diferenciables 

Vamos a estudiar las funciones diferenciables. Entre otras cosas obtendremos 
un criterio sencillo que justificará la diferenciabilidad de la mayoría de funcio- 
nes de interés. Comenzamos observando que en funciones de una variable la 
diferenciabilidad equivale a la derivabilidad. 

Teorema 4.7 Sea / :4cl — > ffi m una función definida en un abierto A y 
sea a € A. Entonces f es diferenciable en a si y sólo si existe la derivada de f 
en a. Además en tal caso df(a)(h) = f'(a)h. 

DEMOSTRACIÓN: Si / es derivable en a entonces existe 

f(a + h)-f(a) 

f (a) = lim , = k, 

w h-o h 



luego 



lím na+h)- na)-kh = 



y si multiplicamos por la función acotada h/\h\ el límite sigue siendo 0, es decir, 
tenemos 

lím na+h)-na)-k h = 
íwo \h\ 

lo que indica que / es diferenciable y que df(a)(h) — f'(a)h. 

El recíproco se prueba igualmente, partiendo de que df(a)(h) — kh se llega 
a que existe /'(a) = k. ■ 

Teorema 4.8 Si f : A C R" — > W n es diferenciable en un punto a, entonces 
f es continua en a. 

Demostración: Tenemos que 

Km f(a + v)-f(a)-df(a)(v) = Q 

v^O \\ V \\ 

Multiplicamos por ||v||, que también tiende a 0, con lo que 
]ímf(a + v) - f( a ) - df(a)(v) = 0. 

v— >0 
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La aplicación df(a) es lineal, luego es continua, luego tiende a 0, luego 
lím f(a + v)- f(a) = 0, 

v— >0 

y esto equivale a 

lím /(a;) = /(a), 

luego / es continua en a. ■ 

Las propiedades algebraicas de la derivabilidad de funciones son válidas 
también para la diferenciabilidad: 

Teorema 4.9 Sean f y g funciones diferenciables en un punto a. Entonces 

a) f + g es diferenciable en a y d(f + g)(a) = df(a) + dg(a). 

b) Si a € R entonces af es diferenciable en a y d(af)(a) = adf(a). 

c) fg es diferenciable en a y d{fg){a) = g{a)df{a) + f{a)dg{a). 

d) si g{a) ^ 0 entonces f/g es diferenciable en a y 

¿(f/n\(n\ - g(«)cj/(«) - f(a)dg(a) 

DEMOSTRACIÓN: Veamos por ejemplo la propiedad c). Llamemos 

f(a + v)- f(a)-df(a)(v) g(a + v) - g(a) - dg(a)(v) 

() = Ñl ' () = ¡Ñ ■ 

Ambas funciones están definidas en un entorno de 0 y tienden a 0. Además 
f(a + v)- /(o) = df(a)(v) + \\v\\E(v), g{a + v) - g(a) = dg{a){v) + \\v\\F(v). 
Entonces 

(fg)(a + v)-(fg)(a) = f(a + v)g(a + v)-f(a)g(a + v) + f(a)g(a + v)-f(a)g(a) 

= (/(« + v)- f{a))g{a + v) + f(a) (g(a + v) - g(a)) . 

Sustituimos f(a + v) — f(a), g(a + v) y g(a + v) — g(a) usando las igualdades 
anteriores. Al operar queda 

(Í9)(a + v) - (fg)(a) - (g(a)df(a) + f(a)dg(a)) = df(a)(v)dg(a)(v) 

+ \\v\\ (df(a)(v)F(v) + E(v)g(a) + E(v)dg(a)(v) + f(a)F(v)) + \\v\\ 2 E(v)F(v). 

Hay que probar que el miembro derecho dividido entre \\v\\ tiende a 0. El 
único término para el que esto no es inmediato es 

df(a)(v)dg(a)(v) 
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pero \\df (a)(v)dg(a)(v)\\ < \\df(a)\\ ||dg(a)|¡ |M| 2 , luego la norma del cociente 
está mayorada por 

\\df(a)\\\\dg(a)\\\\v\\, 
que tiende a 0. ■ 
Veamos ahora la versión en varias variables de la regla de la cadena. 

Teorema 4.10 (Regla de la cadena) Consideremos / : 4 C 1™ — > R m y 

g : B C R m — > R k de modo que f[A] C B. Si f es diferenciable en un punto 
a e A y g es diferenciable en /(a), entonces f o g es diferenciable en a y 

d(fog)(a) = df(a)odg{f(a)). 

DEMOSTRACIÓN: Llamemos h=fogyb= f(a). Dado un v <E R n tal que 
a + v e A, tenemos 

h(a + v)- h(a) = g(f(a + v)) - g(f(a)) = g(b + u) - g(b), 

donde u = f(a + v) — f(a). Consideremos las funciones 

f(a + v)-f(a)-df(a)(v) g(b + u) - g(b) - dg(b)(u) 

E[v) = ÍÑ ' F[u) = ÍÑ ' 

definidas en un entorno de 0 y con límite 0. Se cumple 

h(a + v)- h(a) = dg(b)(u) + \\u\\F(u) = dg(b)(df(a)(v) + \\v\\E(v)) + \\u\\F(u) 
= (df(a) o dg{f(a)))(v) + \\v\\ dg{b)(E{v)) + \\u\\F(u). 



Basta probar que 



para lo cual basta a su vez probar que la función ||u||/||w|| está acotada en un 
entorno de 0. Ahora bien, 



H| = \\df(a)(v) + \\v\\E(v)\ 



<\\df(a)\\ + \\E(v)\\, 



y, como E tiende a 0 en 0, está acotada en un entorno de 0. ■ 
Como consecuencia, J(f o g)(a) = J f(a)Jg(f(a)). 

Equivalentemente, supongamos que tenemos una función z = z(yi, . . . , y m ), 
donde a su vez y¿ — y¿(xi, . . . , x n ). Entonces la regla de la cadena nos dice que, 
si las funciones son diferenciables, 

Vz t (x 1 ,...,x n ) = Jy(xi,...,x„)Vz t (yi,...,y m ), 
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luego 

dz dz dyi dz dy. 



dxi dyi dxi dy m dxi 

Esta es la forma explícita de la regla de la cadena. 

En otros términos, si tenemos dz expresado como combinación lineal de 
dyi, . . . , dy m y cada dy¿ como combinación lineal de dxi, . . . , dx n , es decir, 

dz = (dy 1 ,...,dy n )Vz(y 1 ,...,y m ) t , 

(dy 1 ,...,dy n ) = (dxi, . . . , dx n ) Jy{x x , . . . , x n ), 

entonces, para expresar a dz como combinación lineal de dx-i, . . . , dx n basta 
sustituir el segundo grupo de ecuaciones en la primera, pues así obtenemos 

(dxi, dx n )Jy(x 1 , x„)Vz(yi, . . . , y m )* = (dx 1} dx n )Vz\x 1: x n ), 

es decir, dz{x\ , . . . , x n ) . 

Ejemplo Consideremos las funciones z = ^Jx 2 + y 2 , x — pcosd, y = psen9. 
Suponemos p > 0, con lo que (x,y) ^ (0,0) y todas las funciones son diferen- 
ciables (ver el teorema 4.11, más abajo). Claramente 

x y 

dz = - dx H -^=^= dy, 

^x 2 + y 2 T s /x 2 + y 2 

dx = eos 9 dp — p sen 6 d9, 
dy = sen 9 dp + p eos 9 dO. 

Entonces 

pcos9 , n , . psen9 , ■. 

dz = (cos9dp — pseví9d9) H [sen9dp+ pcos9d9) = dp, 

p p 

que es el mismo resultado que se obtiene si diferenciamos directamente la función 
compuesta z(p, 9) = p. 

Es importante comprender que el paso del primer grupo de ecuaciones a la 
expresión de dz en función de p y 9 no es una mera manipulación algebraica, 
sino que se fundamenta en la regla de la cadena. En este caso particular, lo que 
dice la regla de la cadena es: 

Si llamamos z(p,9) a la función que resulta de sustituir x e y en 
z(x,y) por sus valores en función de p y 9, entonces la diferencial 
de esta función es la que resulta de sustituir x, y, dx, dy en dz(x, y) 
por sus valores en función de p, 9, dp, d9, respectivamente. 

Y esto no es evidente en absoluto. ■ 

El teorema siguiente es el único criterio de diferenciabilidad que necesitare- 
mos en la práctica: 
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Teorema 4.11 Sea f : A C R n — > R m , donde A es un abierto en R n . Si f 
tiene derivadas parciales continuas en A entonces f es diferenciable en A. 

DEMOSTRACIÓN: Podemos suponer m = 1, pues si / tiene derivadas par- 
ciales continuas en A lo mismo vale para sus funciones coordenadas, y si éstas 
son diferenciables / también lo es. 

Sea a e A. Vamos a probar que / es diferenciable en a. Para ello basta 
probar que 



lím 

v— >o 



f(a + v)- f(a) - J2 Dif(a)vi 
¿=i 



0. 



lo que a su vez equivale a que, dado e > 0, exista un 6 > 0 de modo que si 
II vil < 6 entonces 



f(a + v)- f(a)-J2D l f(a)v l 



<e v . 



Por la continuidad de las derivadas parciales tenemos que existe un 5 > 0 tal 
que si \\y — a\\ < S entonces y € A y \Dif(y) — Díf(a)\ < e/n para i = 1, . . . , n. 
Fijemos un v tal que ||u|| < S. 

Definimos F¿ = /(ai + Vi, . . . , a¿ + Vi, a i+ll . . . , a n ). En particular, vemos 
que f(a + v) = F n y f(a) = F 0 , luego 



f(a + v)- f(a) - ¿2 Dif(a)vi 



í=i 



Z) - Fi-i ~ Dif(a)vi) 



i=i 



< Z\Fi-Fi-i-Dif(a)vi\. 

i=l 

Así pues, (teniendo en cuenta que < \\v\\) basta probar que 

\Fi - - Dif(a)Vi\ < - \ví\, 

n 

para i = 1, . . . , n. Esto resulta de aplicar el teorema del valor medio a la función 
de una variable dada por 

9i(t) = /(«i +vi,...,üí-i +Vi-i,ai + tVi,a i+ i,...,a n ). 

Esta función está definida en un intervalo abierto que contiene al intervalo 
[0,1], y el hecho de que / tenga derivadas parciales implica que g¿ es derivable 
en su dominio. En particular es derivable en ]0, 1[ y continua en [0, 1]. Además, 
es claro que 

g¡(t) = Dif(ai + vi, . . . ,a¿_i + u¿_i,a¿ + tvi,a i+ i, . . . ,a„)u¿. 
El teorema del valor medio nos da que existe 0 < t Q < 1 tal que 
Fi - = gi (l) - gi (0) = 5 -(ío)(l - 0). 
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Notemos que y = («i + v lt . . . , a¿_i + u¿_i,a¿ + í 0 u ¿, a ¿+i, ■■■,««) cumple 
||y-a|| = ||(vi, - - - t 0 v*, 0, ... ,0)|| < || f || <6, 

luego 

|F ¿ - - Dif(a)Vi\ = \Dif(y) - D u f(a)\ \ Vi \ < ^ \v¿ 
como había que probar. ■ 

Definición 4.12 Supongamos que una función / : A C K™ — > IR™ admite 
derivada parcial respecto a una variable a;, en todo el abierto A. Si a su vez 
la función D¿/ admite derivada parcial respecto a la variable Xj 611 -A, el GStcl 
derivada se la representa por Dijf. También se usa la notación 



Dijf 



d 2 f 

dxidxj 



Cuando el índice es el mismo se escribe 

a 2 / 

dx 2 



Diif — a ,:2 



Las funciones D^f se llaman derivadas segundas de /. Más generalmente, la 
función D il ... ik f será la función que resulta de derivar / respecto de ii, derivar 
dicha parcial respecto a i 2 , etc. Alternativamente, 

Qkj 



dx^ ■ ■ ■ dx% ' 



donde k\ + • • • + k r — k, representará la función que resulta de derivar k\ veces 
/ respecto a i\, luego k 2 veces la función resultante respecto a ¿ 2 , etc. Estas 
funciones de llaman derivadas parciales de orden k de la función /. 

Diremos que / es de clase C k en A si existen todas sus derivadas parciales 
de orden k en A y todas ellas son continuas en A. En particular, las funciones 
de clase C° son las funciones continuas. 

Obviamente una función es de clase C k+1 si y sólo si todas sus derivadas 
parciales son de clase C k . El teorema anterior afirma que todas las funciones 
de clase C 1 son diferenciables. Si una función / es de clase C 2 , entonces su 
derivadas parciales son de clase C 1 , luego son diferenciables, luego son continuas 
y por lo tanto / es también de clase C 1 . Por el mismo argumento se prueba en 
general que si k < r entonces toda función de clase C r es de clase C k . 

Las reglas de derivación justifican inmediatamente que la suma y el producto 
por un escalar de funciones de clase C k es una función de clase C k . El producto 
de funciones de clase C k (con valores en M) es de clase C k . Lo mismo vale para 
el cociente si exigimos que el denominador no se anule. 

Ejercicio: Probar que la composición de dos funciones de clase C k es de clase C k . 

Ahora vamos a probar un teorema muy importante sobre derivadas sucesivas, 
pues nos dice que el orden de derivación no importa: 
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Teorema 4.13 (Teorema de Schwarz) Si f : A C IR™ — > M™ es una función 
de clase C 2 en el abierto A, entonces Dijf(a) = Djif(a). 

Demostración: No perdemos generalidad si suponemos m = 1. También 
podemos suponer que n = 2, pues en general podemos trabajar con la función 

F\Xi, Xj ) — /(&!,..., Xi , . . . , , . . . ■ 

Así pues, probaremos que D 12 f{a) = D 2 \f(á). Sea a = (ai,a 2 ). Considere- 
mos la función 

A/O) = /(ai + h,a 2 + h) - /(ai + á,a 2 ) - f(a 1 ,a 2 + h) + f(a 1 ,a 2 ), 
definida en un entorno de 0. Vamos a probar que 

Por simetría este límite será también D 2 \f(a) y el teorema estará probado. 

Dado e > 0, la continuidad de D\ 2 f en a implica que existe un h 0 > 0 tal 
que si 0 < k, k' < /i 0 , entonces \Di 2 f{a\ + k,a 2 + k') — D\ 2 f(ai,a 2 )\ < e. 

Podemos tomar ft 0 suficientemente pequeño para que si 0 < h < h 0 la función 

G(t) = f(t,a 2 + h)- f(t,a 2 ) 

esté definida en el intervalo [ai, ai + h]. Por el teorema del valor medio existe 
un número 0 < k < h tal que 

Af(h) = G(ai + h)- G(oi) = hGf (oí + fe) 

= h(D 1 f(a 1 + k,a 2 + h)- D 1 f(a 1 + k, a 2 )). 

Ahora aplicamos el teorema del valor medio a la función 

H(t) = D 1 f(a 1 +k,t) 

en el intervalo [a 2 , a 2 + h], que nos da un número 0 < k' < h tal que 

D\f(ai + k,a 2 + h) - D í f{a 1 + k, a 2 ) = D 12 f(ai + k,a 2 + k')h. 

En total tenemos que 

Af(h) = D 12 f(a 1 + k 1 a 2 + k')h 2 1 

luego 

A/(/i) 



/;2 I>i2/(a) 



|A 2 /(oi + fc,«2 + k') - D 12 f(a)\ < e, 



siempre que 0 < h < h, 



o- 



El teorema de Schwarz implica claramente que al calcular cualquier derivada 
parcial de orden k de una función de clase C k es irrelevante el orden en que 
efectuemos las derivadas. 
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Ahora vamos a encaminarnos a probar el teorema de la función inversa. 
Esencialmente se trata de probar que las inversas de las funciones biyectivas y 
diferenciables son diferenciables. La situación es mas complicada que en el caso 
de una variable, pues en el capítulo anterior vimos que toda función derivable 
cuya derivada no se anula es monótona, mientras que no hay ningún resultado 
análogo para el caso de varias variables. Por ello vamos a necesitar varios 
resultados previos. Entre otras cosas, nos apoyaremos en el concepto de extremo 
relativo y su relación con la diferenciabilidad. La situación en esto sí es análoga 
a la de una variable. 

Definición 4.14 Sea / : A C K™ — > M. y a € A. Diremos que / tiene un 
mínimo relativo en a si existe un entorno G de a tal que para todo p £ G se 
cumple f(p) > f(a). Similarmente se define un máximo relativo. Diremos que 
a es un extremo relativo si es un máximo o un mínimo relativo. 

Teorema 4.15 Sea f : A C K™ — > R una función diferenciable en un punto 
a £ A. Si f tiene un extremo relativo en a, entonces df(a) = 0. 

Demostración: Sea v e R n y consideremos la función <j>(h) = f(a + hv), 
para un cierto vector v £ IR™, definida en un entorno de 0. Es claro que <j> tiene 
un extremo relativo en 0. Sea g(h) = a + hv. Por la regla de la cadena 

0 = <//(0) = d0(O)(l) = 4f (5(0)) (d»(0)(l)) = df(a)(v). 



Teorema 4.16 Sea f : Bs(a) C K™ — > K™ una aplicación continua, diferen- 
ciable en Bs(a), y tal que para todo y £ B¡{a) se cumpla \Jf(y)\ ^ 0. Su- 
pongamos además que para todo x <E dBs(a) se cumple f{x) ^ f(a). Entonces 
/[-B¿(a)] es un entorno de f(a). 

DEMOSTRACIÓN: Sea g : dB¿(a) — > IR la aplicación definida mediante 
g(x) — ||/(a;) — /(a)||. Por compacidad alcanza su mínimo en un punto x. Por 
hipótesis m = g(x) > 0. Tenemos, pues, que g(z) > g(x), para todo z tal que 
\\z — a\\ = 5. Vamos a probar que B m / 2 (f(a)) C f[Bs(a)] . 

Sea y <E B m / 2 (f(a)). Consideremos la función h : B$(a) — > E dada por 
h{x) — \\f(x) — y\\. Por compacidad alcanza su mínimo en un punto z y, puesto 
que h(a) = ||/(a) — y|| < m/2, vemos que h(z) < m/2. 

Si x € dBg(a), entonces 

/»(*) = \\f(x) y\\ > \\f(x) f(a)\\ ||/(o) - > - |> m -| = |, 

luego /i(x) no es el mínimo de h. En otros términos, z ^ dBs(a), luego 2 € -B<s(a) 
Es claro que h 2 también alcanza su mínimo enzy 

h\x) = Y,(fk{x)-y k ) 2 . 
k=i 
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Por consiguiente, 

n 

D 3 h 2 (z) = ^2(/ fc (z) - y^DjMz) = 0, 
k=i 

pues z es un extremo. Matricialmente tenemos (f(z) — y)J f{z) 1 = 0 y como el 
determinante de la matriz es no nulo por hipótesis, y = f(z) € /[B¿(a)] . ■ 

Teorema 4.17 Sea / : i C R" — > W 1 una aplicación inyectiva, diferenciable 
en el abierto A y tal que \ Jf(x)\ ^ 0 para todo x € A. Entonces f es abierta, 
luego f : A — > f[A] es un homeomorfismo . 

Demostración: Sea U un abierto en A. Veamos que f[U] es abierto en 
W l . Tomemos un punto a € U y veamos que f[U] es entorno de /(a). Existe 
un 5 > 0 tal que B¿(a) C U, y la restricción de / a esta bola cerrada está en las 
hipótesis del teorema anterior. Por consiguiente f[Bs(a)] C f[U] es un entorno 
de f(a). m 

Ahora ya podemos probar el teorema de la función inversa. 

Teorema 4.18 (Teorema de la función inversa) Sea f : A C K™ > R" 

una función inyectiva de clase C k , con k > 1, en el abierto A y tal que se cumpla 
| Jf(x)\ ^ 0 para todo x £ A. Entonces B = f[A] es abierto y : B — > A es 
de cZase C fe en B. 

DEMOSTRACIÓN: Llamemos g = Por el teorema anterior / y g son 

homeomorfismos. Veamos que tiene g parciales continuas. Sea e¿ el ¿-ésimo 
vector de la base canónica de IR™. Sea b € B y a — g(b). Tomemos una bola 
abierta B v (a) C A y un a > 0 suficientemente pequeño tal que el segmento de 
extremos b y b + ae¿ esté contenido en /[B^a)]. Sea a' — g(b+ aei). Entonces 
a' e B^a), luego el segmento de extremos aya' está contenido en A. 

Claramente f(a') — f(a) = aei. Si fj es la j-ésima función coordenada de 
/, tenemos 

ÍÁ a ')~ fj(a)=aS ij , 

donde (á¿j) es la matriz identidad. Aplicamos el teorema del valor medio a la 
función <¡>{t) = fj(a + t(a' — a)), definida en [0, 1], en virtud del cual existe 
0 < t < 1 tal que 

aóij = 0(1) - 0(0) = #(í)(l) = df j (a + t(a' - a))(a' - a). 

Sea z 3 = a + t(a' — a). Así 

n 

aS ü = ^Dkfjiz 1 )^ - a k ). 
fe=i 

Matricialmente tenemos 



a/=(a'-a)(£) fe / J (^)). 
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La función h : A n — > IR dada por h(z l , . . . , 0™) = \(D k fj(z J ))\ es continua, 
pues las derivadas parciales son continuas y el determinante es un polinomio. 
Por hipótesis tenemos que h(a, . . . , a) ^ 0, luego existe un entorno de (a, ... , a) 
en el cual h no se anula. Tomando a suficientemente pequeño podemos exigir 
que (a', . . . , a') esté en una bola de centro (a, . . . , a) contenida en dicho entorno, 
con lo que el punto (z 1 , . . . , z n ) que hemos construido también está en dicho 
entorno, luego [(-D^/j^))] ^ 0 y podemos calcular la matriz inversa, cuyos 
coeficientes se expresan como un cociente de determinantes de matrices cuyos 
coeficientes son derivadas parciales. En definitiva obtenemos una expresión de 
la forma 

a' k -a k = PkjDkfj(*y 
donde P k y Qk son polinomios. Por definición de a y a' tenemos 

a QkiPHÍiizj))' 

Tomando a suficientemente pequeño podemos conseguir que \\z l — a\\ se 
haga arbitrariamente pequeño. Por la continuidad de las derivadas parciales 
podemos exigir que \D k fj(z 3 ) — D k fj(a)\ se haga arbitrariamente pequeño y por 
la continuidad de los polinomios P k y Qk podemos hacer que el miembro derecho 
de la ecuación anterior se aproxime cuanto queramos al término correspondiente 
con a en lugar de los puntos z l . En definitiva, existe 

D i9k (p) - I- gfc(&+ ^- fffc(b) = MMÍgM, 
UK « Qk(D k fj(g(b))) 

Más aún, los polinomios P k y Q k son los que expresan las soluciones de una 
ecuación lineal en términos de sus coeficientes, luego no dependen de b, luego esta 
expresión muestra también que Dig k es una composición de funciones continuas, 
luego es continua. Más en general, si / es de clase C k , entonces g también lo 
es. ■ 

Si / está en las condiciones del teorema anterior tenemos que / o / _1 = 
/ _1 o / = 1, luego por la regla de la cadena 

df(á) o df-\b) = d/ _1 (6) o df(a) = 1, 

luego las dos diferenciales son biyectivas y <i/ _1 (6) = df(a) . 

Equivalentemente, si y¿(xi, . . . ,x n ) es una transformación Invectiva y dife- 
renciaba con determinante jacobiano no nulo y llamamos £¿(yi, . . . , y n ) a I a 
función inversa, entonces el sistema de ecuaciones 
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tiene por matriz de coeficientes a la matriz jacobiana de la transformación, 
luego podemos despejar dx\, . . . , dx n en función de dy\, . . . , dy n y así obtenemos 
precisamente la diferencial de la función inversa. 

Ejemplo Como ya advertíamos, al contrario de lo que sucede en una variable, 
el hecho de que una aplicación tenga diferencial no nula en todo punto (o incluso 
determinante jacobiano no nulo) no garantiza que sea biyectiva. Por ejemplo, 
consideremos f(x,y) = (e x eos y, e x sen y) (vista como aplicación de C en C, se 
trata simplemente de la exponencial compleja). La matriz jacobiana de / es 

(e x eos y e x sen y \ 
— e x sen y e x eos y J 

y su determinante en cada punto (x, y) es e x ^ 0. Por otro lado es fácil ver que 
/ no es biyectiva. ■ 

Lo máximo que podemos deducir del hecho de que el determinante jacobiano 
no se anule es que la función es localmente inyectiva. La prueba se basa en un 
argumento que hemos usado en la prueba del teorema de la función inversa. 

Teorema 4.19 (Teorema de inyectividad local) Sea f : A C K™ > K" 

una función de clase C 1 en el abierto A y sea a € A tal que \Jf(a)\ ^ 0. 
Entonces existe un entorno B de a tal que \ Jf(x)\ ^ 0 para todo x £ B y f es 
inyectiva sobre B. 

Demostración: La función h : A n — > R dada por 

h(z\...,z n ) = \(D k f j (zi))\ 

es continua, pues las derivadas parciales son continuas y el determinante es un 
polinomio. Por hipótesis tenemos que h(a, . . . , a) 0, luego existe un entorno 
de (a, . . . , a) en el cual h no se anula. Este entorno lo podemos tomar de la 
forma Bg(a) x • • • x Bg(a). Tomaremos B — Bg(a). 

Veamos que si x, y € Bg(a) y f(x) = ¡(y) entonces x = y. Consideremos la 
función <j)(t) = fi(x + t(y — x)), definida en [0, 1]. Claramente es derivable. Por 
el teorema del valor medio, 

My) - fi{x) = d(j)(U)(í) = dfi(x + U{y - x)){y - x) = df^z^y - x), 

donde z % es un punto entre x e y, luego z l € Bg(a). Por lo tanto 

n 

fi(y) - f%(x) = D kMz l )(yk - x k ), 
k=i 

lo que matricialmente se expresa como 

Q = f(y)-f(x) = (y-x)(D k f i (z i )). 
La matriz tiene determinante h{z x , . . . , z n ) ^ 0, luego ha de ser x = y. m 

Para terminar generalizamos a varias variables un hecho que tenemos pro- 
bado para el caso de una: 
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Teorema 4.20 Si f : A C K™ — > IR m es una función diferenciable en un 
abierto conexo A y df = 0, entonces f es constante. 

DEMOSTRACIÓN: Podemos suponer m = 1. Dados dos puntos a, b e A, 
existe una poligonal contenida en A con extremos a y b. Basta probar que / 
toma el mismo valor en los vértices de la poligonal, luego en definitiva basta 
probar que si o y & son los extremos de un segmento contenido en A entonces 
f(a) = f(b). Consideramos la función <f>(t) = f(a + t(b — a)) en [0,1] y le 
aplicamos el teorema del valor medio. Concluimos que 

/(&) - f(a) = <j>'{t) = df(a + t(b - a))(b - a) = 0. 



4.3 Curvas parametrizables 

Las técnicas de este capítulo nos capacitan para estudiar curvas mas efi- 
cientemente que las del capítulo anterior. En efecto, allí estudiábamos curvas 
considerándolas como gráficas de funciones de una variable, pero esto no per- 
mite trabajar con curvas cualesquiera. Por ejemplo, una elipse no es la gráfica 
de ninguna función. Ahora podemos aplicar la derivabilidad al estudio de curvas 
en el sentido de aplicaciones x : I — > IR", donde / es un intervalo en IR. Para 
que una tal aplicación x pueda ser llamada "curva" razonablemente, debere- 
mos exigir al menos que sea continua. Aquí nos centraremos en las curvas que 
además son derivables. Si una curva está definida en un intervalo cerrado [a, 6], 
exigiremos que sea derivable en ]a,b[. A estas curvas las llamaremos arcos. Si 
x : [a, b] — > IR", los puntos x(a) y x(b) se llaman extremos del arco. Concreta- 
mente, x(a) es el extremo inicial y x(b) es el extremo final. La gráfica de una 
función continua / : [a, b] — > IR puede identificarse con el arco x(t) = (t,x(t)). 
De este modo, el tratamiento de los arcos que estamos dando aquí generaliza al 
del capítulo anterior. 

Según lo dicho, una curva no es un mero conjunto de puntos en IR", sino un 
conjunto de puntos recorridos de un modo en concreto. Si x(t) es una curva, la 
variable t se llama parámetro de la misma. Conviene imaginarse a t como una 
variable temporal, de modo que x(t) es la posición en el instante t de un punto 
móvil que recorre la curva. La imagen de x es la trayectoria del móvil. 

Vamos a interpretar la derivabilidad de una curva x(t) en un punto t. Si 
existe x'(t) = v ^ 0, entonces para valores pequeños de h tenemos 

^(t + h) -x(t) ^ (41) 

luego x(t+h) sa x(t) + hv. La curva x(t) + hv, cuando varía h, recorre los puntos 
de una recta, y estamos diciendo que para valores pequeños de h la curva x se 
parece a dicha recta. Así pues, la recta de dirección x'(t) se confunde con la 
curva alrededor de x(t), y por ello la llamamos recta tangente a £ en x(t). Esto 
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interpreta la dirección de x'(t). Es fácil ver que su sentido es el sentido de avance 
al recorrer la curva. Observemos que si / : / — > R es una función derivable en 
un punto t, entonces la tangente del arco x(t) — (t, f(t)) es la recta de dirección 
(l, f'(t)), luego su pendiente es f'(t), luego coincide con la tangente tal y como 
la definimos en el capítulo anterior. 

Ya tenemos interpretados la dirección y el sentido de x'(t). Falta interpretar 
su módulo. Claramente se trata del límite del módulo de (4.1). La cantidad 
\\x(t + h) — x(t)\\ es la distancia que recorremos en h unidades de tiempo desde 
el instante t, luego al dividir entre \h\ obtenemos la distancia media recorrida 
por unidad de tiempo en el intervalo de extremos t y t + h, es decir, la velocidad 
media en dicho intervalo. El límite cuando h — > 0 es, pues, la velocidad con 
que recorremos la curva en el instante t. En realidad los físicos prefieren llamar 
velocidad a todo el vector x'(t), de modo que la dirección indica hacia dónde 
nos movemos en el instante t y el módulo indica con qué rapidez lo hacemos. 

Conviene precisar estas ideas. La primera ley de Newton afirma que si un 
cuerpo está libre de toda acción externa, permanecerá en reposo o se moverá en 
línea recta a velocidad constante. Todo esto se resume en que su velocidad en 
sentido vectorial permanece constante. 

Ejemplo Consideremos la curva x(t) = (eos t, sen i), definida en el intervalo 
[0, +oo[. Esta curva recorre infinitas veces la circunferencia de centro (0,0) y 
radio 1. Su velocidad es x'(t) = (— sen í, eos i), cuyo módulo es constante igual a 
1, esto significa que recorremos la circunferencia a la misma velocidad, digamos 
de un metro por segundo. Para que un objeto siga esta trayectoria es necesario 
que una fuerza lo obligue a mantenerse a la misma distancia del centro. Por 
ejemplo, el móvil podría ser un cuerpo que gira atado a una cuerda. El hecho 
de que x'(2ir) = (0,1) significa que si en el instante 2ir se cortara la cuerda 
entonces el cuerpo, libre ya de la fuerza que le retenía, saldría despedido hacia 
arriba a razón de un metro por segundo. 

Consideremos ahora la curva x(t) = (eos í 2 , sen t 2 ). Su trayectoria es la 
misma, pero ahora la velocidad es x'(t) — (— 2t sen t 2 ,2t cosí 2 ), cuyo módulo es 
2t, lo que significa que ahora el móvil gira cada vez más rápido. Comienza a 
velocidad 0, al dar una vuelta alcanza la velocidad de 2 metros por segundo, a 
la segunda vuelta de 4, etc. ■ 

Las consideraciones anteriores muestran que la derivabilidad de una curva 
se traduce en la existencia de una recta tangente salvo que la derivada sea nula. 
La existencia de una recta tangente en x(t) significa que el arco se confunde con 
una recta alrededor de x(t), con lo que el arco no puede formar un "pico" en 
x(t). Esto ya no es cierto si x'(t) = 0. Por ejemplo, la curva x(t) = (i 3 , |£ 3 |) es 
derivable en 0, pues su derivada por la izquierda coincide con la de (i 3 , — t 3 ) y 
su derivada por la derecha coincide con la de (t 3 ,t 3 ), y ambas son nulas, pero 
su gráfica es la misma que la de (t, \t\), es decir, la de la función |ar|, que tiene 
un pico en 0. Esto nos lleva a descartar las curvas con derivada nula. 
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Definición 4.21 Una curva parametrizada regular x : I — > IR™ es una apli- 
cación definida sobre un intervalo abierto / C M derivable y con derivada no 
nula en ningún punto. 

El vector 

x'(t) 

T(t) = 



\x'(t)\\ 

se llama vector tangente a a; en el punto x{t). La recta que pasa por x(t) con 
dirección T(t) se llama recta tangente a x por x(t). 

Hemos visto un ejemplo de una misma trayectoria recorrida a velocidades 
distintas. Desde un punto de vista geométrico, lo que importa de una curva 
es su forma, y no la velocidad con la que se recorre. Vamos a explicitar esta 
distinción. 

Dado un arco parametrizado x : [a,b] — > IR", un cambio de parámetro es 
una aplicación t : [u, v] — > [a, b] que se extiende a un intervalo abierto mayor 
donde es derivable y la derivada no se anula. Por consiguiente t es biyectiva y 
t' tiene signo constante. Diremos que t es un cambio de parámetro directo o 
inverso según si t' > 0 o t' < 0. El arco parametrizado y(s) = x(t(s)) se llama 
reparametrización de x mediante el cambio de parámetro t. 

Diremos que dos arcos parametrizados regulares x e y son (estrictamente) 
equivalentes si existe un cambio de parámetro (directo) que transforma uno en 
otro. 

Es claro que la identidad es un cambio de parámetro directo, la inversa 
de un cambio de parámetro (directo) es un cambio de parámetro (directo) y la 
composición de dos cambios de parámetro (directos) es un cambio de parámetro 
(directo). De aquí se sigue que la equivalencia y la equivalencia estricta son 
relaciones de equivalencia entre los arcos parametrizados. 

Llamaremos arcos regulares a las clases de equivalencia estricta de arcos 
parametrizados regulares, de modo que dos elementos de la misma clase se 
considerarán dos parametrizaciones de un mismo arco. 

Todas las parametrizaciones de un arco tienen la misma imagen, a la que 
podemos llamar imagen del arco. Los cambios de parámetro directos son cre- 
cientes, por lo que dos parametrizaciones de un mismo arco tienen los mismos 
extremos, a los que podemos llamar extremos del arco. 

Consideremos dos parametrizaciones x : [a, b] — > IR™, y : [c,d\ — > IR™ de 
un mismo arco. Entonces y(s) = x(t(s)) para un cierto cambio de parámetro 
directo t. Consideremos ahora dos cambios de parámetro inversos 

u : [a', b'} — >[a,b], v: [c', d'} — ► [c, d] 

y las reparametrizaciones x(u(r)), y(v(r)). Entonces y(v(r)) = x(t(v(r)) = 
x(tí(w _1 (í(í;(r)))) y v o t o u^ 1 es un cambio de parámetro directo, luego las 
dos reparametrizaciones corresponden a un mismo arco. Por lo tanto, podemos 
definir el arco inverso de un arco x al arco resultante de componer con un 
cambio de parámetro inverso cualquiera de las parametrizaciones de a;. Lo 
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representaremos por —x. Es claro que x y —x tienen la misma imagen, pero el 
extremo inicial de x es el extremo final de —a; y viceversa. 

De este modo, la noción de arco como clase estricta de arcos parametrizados 
recoge el concepto geométrico de arco regular independiente del modo en que 
se recorre, pero conservando el sentido del recorrido. Si consideramos clases no 
estrictas identificamos cada arco con su inverso, y con ello hacemos abstracción 
incluso del sentido en que lo recorremos. Todos estos conceptos se aplican 
igualmente a curvas cualesquiera. 

Longitud de un arco Consideremos el arco x (t) — (rcosí, rsení), con r > 0. 
Su derivada tiene módulo r, lo que se interpreta como que el arco recorre la cir- 
cunferencia de centro (0, 0) y radio r a una velocidad constante de r unidades de 
longitud por unidad de tiempo. Puesto que recorre la circunferencia completa 
en 2tt unidades de tiempo, concluimos que el espacio que recorre, es decir, la 
longitud de la circunferencia, es 2nr. Más en general, mediante esta parame- 
trización recorremos un arco de a radianes en a unidades de tiempo, luego la 
longitud de un arco de a radianes es ctr, tal y como anticipábamos en el capítulo 
anterior. Vamos a generalizar este argumento para definir la longitud de un arco 
arbitrario. 

Sea x : [a,b] — > K" un arco y vamos a definir la función s : [a,b] — > K 
tal que s(t) es la longitud de arco entre x(a) y x(t). Obviamente ha de cumplir 
s(a) = 0. Supongamos que es derivable y vamos a calcular su derivada en un 
punto t. El arco x se confunde con una recta alrededor de x(t). Esto significa 
que si h es suficientemente pequeño el arco entre x(t) y x(t + h) es indistinguible 
del segmento que une ambos puntos, luego tendremos 



donde el signo es el de h. La aproximación será mejor cuanto menor sea h. 
Dividiendo entre h queda 



Estos dos cocientes se parecerán más cuanto menor sea h, lo que se traduce 
en que los límites cuando h — > 0 han de coincidir. Así: 



s(t + h) - s(t) « ±\\x(t+h) - x(t)\\, 



s(t + h)- s(t) 
h 



x(t + h) - x(t) 
h 



ds 



= l|z'(í)ll, 



(4.2) 



luego 




En particular, la longitud del arco completo será 
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Definición 4.22 Diremos que un arco parametrizado regular x : [a, b] — > W 1 

es rectificable si la función ||x'(í)|| tiene primitiva en [a, b] (es decir, si tiene 
primitiva en el intervalo abierto y ésta se extiende continuamente al intervalo 
cerrado), y entonces llamaremos longitud de x al número real 



L(x) 



\\x'(t)\\dt. 



Notar que como el integrando es positivo, su primitiva ha de ser estricta- 
mente creciente, luego L(x) > 0. La longitud de un arco parametrizado coincide 
con la de cualquiera de sus reparametrizaciones. En efecto, si y(s) = x(t(s)), 
entonces y'(s) = x' (t(s))t' (s) , luego 



x)= / \\x\t)\\dt= / \\x'(t(s))\\t'(s)ds = / \\y'(s)\\ds = L(y). 

Ja J s(a) J s(a) 



Ejercicio: Comprobar que la longitud de un arco coincide con la de su opuesto, y 
que la longitud es invariante por isometrías. 

Ahora es inmediato comprobar que la longitud de un arco de circunferencia 
de radio r y amplitud a es a. En particular la longitud de una circunferencia 
de radio r es 2nr. De hecho, los griegos llamaron ir a esta constante por ser la 
proporción entre el perímetro de la circunferencia y su diámetro. 

Sea x : [a, b] — > R n un arco rectificable y sea s(t) la longitud de arco entre 
x(a) y x(t). Hemos visto que se trata de una función derivable y que s'(t) = 
\\x'(t)\\. Por lo tanto s es creciente y biyectiva. Su inversa t : [0,L] — > [a, b] 
es un cambio de parámetro, la función x(s) = x(t(s)) es una reparametrización 
del arco y 



x'(s) = x'{t)t\s) = 



\x'(t)\ 



luego ||a;'(s)|| = 1 y así x'(s) = T(s). Más concretamente, x(s) se caracteriza 
por que la longitud de arco entre x(0) y x(s) es s. A esta parametrización 
del arco la llamaremos parametrización natural. También diremos entonces 
que x está parametrizado por el arco Desde un punto de vista cinemático, la 
parametrización natural se interpreta como la que recorre el arco a velocidad 
constante igual a 1 (constante en módulo). 



Ejemplo La trayectoria de un clavo de una rueda que gira se conoce con el 
nombre de cicloide. Vamos a calcular la longitud de una vuelta de cicloide. 

Primeramente necesitamos encontrar una parame- 
trización de la curva. Supongamos que la rueda gira 
sobre el eje y = 0 y que el clavo parte de la posición 
(0,0). Si llamamos r al radio de la circunferencia, ve- 
mos que cuando la rueda ha girado t radianes su centro 
se encuentra en el punto (rt,r), luego el clavo se en- 
cuentra en x(t) = (rt — rsení, r — reos i). 
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Por consiguiente x'(t) = r(l — cosí, sen t), 



\\x'(t)\\ = rV2 - 2 eos t = 2r sen -. 



Vemos que los múltiplos de 2ir son puntos singulares de la cicloide. Corres- 
ponden a los momentos en que el clavo toca el suelo. Entonces se para y cambia 
de sentido. 




Es fácil calcular 



L 



2tt 



2r sen - di = 4r 



eos 



8r. 



Ejercicio: Calcular la longitud de la astroide, dada por x(t) = (a eos 3 t, asen 3 1). 




Ejemplo La trayectoria de un clavo de una rueda que gira sobre una circun- 
ferencia se llama epicicloide. El caso más simple lo tenemos cuando ambas 
circunferencias tienen el mismo radio. La curva se llama entonces cardioide, 
porque su forma recuerda a un corazón. 



Supongamos que la circunferencia fija tiene 
centro en (a/4, 0) y radio a/4 y que el clavo parte 
de la posición (0, 0). Cuando la rueda ha girado a 
radianes la situación es la que indica la figura. El 
cuadrilátero tiene dos ángulos y dos lados iguales, 
por lo que los otros dos ángulos también tienen la 
misma amplitud 9. Es claro entonces que 



luego 



a a 
P= 2 + 2 4 COS( 



P = gil + cosé>), 




donde 9 £ ]— Ésta es la ecuación de la cardioide en coordenadas polares. 
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Vamos a ver en general cuál es la expresión de la longitud de una curva 
parametrizada en coordenadas polares (p(í),#(t)). Notemos que (4.2), para el 
caso de dos variables puede escribirse también como 



Se dice que ésta es la expresión del elemento de longitud (es decir, de una 
longitud infinitesimal) en coordenadas cartesianas. Se trata de la versión infi- 
nitesimal del teorema de pitágoras. Si diferenciamos las relaciones x = p eos 9, 
y = p sen 9 obtenemos 

dx = eos 9 dp — p sen 9 d9 7 dy = sen 9dp+ p eos 9 d6. 
Sustituyendo queda 



ds 2 = dx 2 + dy 2 . 



ds 2 =dp 2 + p 2 d9 2 . 



(4.3) 



Ésta es la expresión del elemento de longitud de un arco en coordenadas 
polares. Aplicado a la cardioide resulta 




de donde 



ds = a eos - d9. 



Así pues, la longitud de la cardioide es 
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Ejemplo Consideremos un cuerpo puntual situado en 
(1,0) atado a una cuerda de longitud l con su otro ex- 
tremo en (0,0). Estiramos de la cuerda de modo que 
su extremo suba por el eje Y. La trayectoria del cuerpo 
arrastrado por la cuerda recibe el nombre de tractriz. 
Vamos a obtener una parametrización de la tractriz. Un 
cuerpo estirado por una cuerda se mueve en la dirección 
de la cuerda, luego ésta ha de ser tangente a la trayec- 
toria. Si llamamos y — f(x) a la tractriz, definida para 
0 < x < l, entonces su recta tangente es 

Y = f(x) + f'(x)(X-x). 



Cortará al eje Y en el punto (0, f(x) — f'(x)x). Éste es el punto donde está 
el extremo de la cuerda cuando el otro extremo está en (x, f(x)). La distancia 
entre ambos debe ser, pues, igual a l. Por consiguiente: 



+ m v = i 



Despejando obtenemos 



dy 



P 



1 dx. 



El signo negativo se debe a que, tal y como hemos planteado el problema, la 
función y ha de ser decreciente. El cambio x = lsen9 biyecta los números 
0 < x < l con los números tt/2 < 9 < ir. La igualdad anterior se transforma en 



dy = -l 



' -ÍCOS0 d9 = l C ° 



sen 2 9 



sen 9 



2 a ld9 

d9= --Isen9d9. 



sen 9 



La posición inicial corresponde a x = l, luego a 9 = -k/2, es decir, y(n/2) = 0, 
luego 



T/2 sení j n/2 

Existen reglas de integración que permiten calcular metódicamente la pri- 
mera primitiva. Como no nos hemos ocupado de ellas nos limitaremos a dar el 
resultado. El lector puede comprobar sin dificultad que es correcto derivando 
la solución que presentamos. 



- I 



sen t dt. 



y{0) = i 



log tan 



tt/2 



l [eos £]^/ 2 = l log tan - + l eos 9. 



Así pues, la tractriz viene dada por 



9 



T{9) = (Zsen0,Zlogtan- + Zcos0), 9 e [w/2,ir[. 
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r { e) = (i C o S e,i^), \\r m = -i™° 



Su derivada es 

T'(B) = (icosOJ ,,- 

\ sen O ) senfl 

La tractriz es regular en ]n/2, n[. La longitud de un arco de tractriz es 

r 6 cos i 

s(6) = -l / dt = -Z[logsení]* /2 = -Zlogsenfl. 

./7l72 SCní 



Vector normal y curvatura Sea x(s) un arco parametrizado por la longitud 
de arco. Supongamos que admite derivada segunda. Derivando la igualdad 
x'(s)x'(s) = 1 obtenemos que 2x"(s)x'(s) = 0, luego x"(s) _L x'(s). Supuesto 
que x"(s) ^ 0 podemos definir el vector normal del arco como 

x"{s) 

N(s) 



lar" (a) 



y la curvatura del arco como k(s) = ||x"(s)||. 

Para interpretar la curvatura llamemos A6 al ángulo entre los vectores x'(s) 
y x'(s + As), donde A0 es una función de As. Puesto que x' tiene módulo 
constante igual a 1, la trigonometría nos da que 

\\x'(s + As) -x'(s) || = 2sen^. X^A 2 sen(A6»/2) 



Por consiguiente, 




\x'(s + As)-x'(s)\\ _ sen^ A6 



\As\ A9/2 \As\' 

Es claro que A9 — > 0 cuando As — > 0, luego 

k(s) = lim 7-7 — r. 
v y As^O |As| 

Así pues, la curvatura mide la variación del ángulo del vector tangente por 
unidad de arco recorrido. Es claro que cuanto mayor sea la curvatura "más 
curvado" estará el arco. 

Ejemplo La parametrización natural de una circunferencia de radio r es 
x(s) = (rcos(s/r),rsen(s/r)). El vector tangente es, por lo tanto, x'(s) = 
(— sen(s/r),cos(s/r)). De aquí obtenemos 

/ 1 si s\ 

x (s) = — cos — sen - , 
V r r r r 
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con lo que el vector normal es N(s) = — (cos(s/r), sen(s/r)) y la curvatura es 
n(s) = 1/r. Intuitivamente es claro que una circunferencia está menos curvada 
cuanto mayor es su radio, tal y como se pone de manifiesto en la fórmula que 
hemos obtenido. ■ 

Dada una curva x de curvatura no nula en un punto dado x(s), la circunfe- 
rencia de radio r = 1/ n{s) y centro x(s) — kN(s) pasa por x(s) y tiene el mismo 
vector tangente, el mismo vector normal y la misma curvatura en este punto. 
Esto hace que sea la circunferencia que más se parece a x en un entorno de x(s) 
y se la llama circunferencia osculatriz a x por x(s). El radio r(s) = 1/k{s) se 
llama radio de curvatura de x en x(s). 

Veamos ahora fórmulas explícitas para calcular el vector normal y la curva- 
tura cuando la parametrización no es la natural. Conviene usar el lenguaje de la 
cinemática. Supongamos que x(t) representa la posición de un móvil puntual en 
función del tiempo. Llamaremos x(s) a la parametrización natural. Entonces la 
velocidad del móvil es V = x'(t). Si llamamos v = \\V\\, entonces sabemos que 
v = s'(t), con lo que v es la velocidad sobre la trayectoria, que mide la distancia 
recorrida por unidad de tiempo. Además V = x'(t) = x'(s)s'(t), es decir, 

V = vT. 

Se define el vector aceleración como A = V = X"(t). Derivando en la 
relación anterior tenemos 

A = v'{t)T{t)+v{t)T'{t). 

Llamaremos a(t) = v'(t), que es la aceleración sobre la trayectoria, es decir la 
variación de la velocidad sobre la trayectoria por unidad de tiempo. Aplicando 
la regla de la cadena a T(t) = T(s(t)) obtenemos T'{t) = T'(s)s'(t) = kvN, 
luego 

V 2 

A = aT+ kv 2 N = aT+—N. 

r 

Vemos, pues, que la aceleración se descompone de forma natural en una 
componente tangencial, que mide la variación del módulo de la velocidad, y una 
componente normal, que determina la curvatura. 

Ahora multiplicamos esta igualdad por sí misma: ||A|| 2 = a 2 + k 2 v 4 , de 
donde 

|,4|| 2 - a 2 



K 2 = 



Ahora bien, 
luego 

lo que nos da 



a = v = 



vv vv 



\\A\\ 2 v 2 - (VV) 2 _ ||^A,4|| S 

v 6 ,,6 



v 3 
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Las dos últimas igualdades suponen que la imagen de x está en R 3 . En el 
lenguaje geométrico hemos obtenido las fórmulas siguientes: 

Ik'll' ' \W\\ \\x'Ax"\\ ' \\x'\\ 3 . 1 ' ' 



En el caso de curvas planas es conveniente modificar como sigue el vector 
normal y la curvatura. Fijada una orientación en el plano, definimos el vector 
normal de una curva x(s) parametrizada por el arco como el vector unitario N(s) 
que es perpendicular a T(s) y de modo que la base (T(s), N(s)) esté orientada 
positivamente. Esta definición puede diferir de la anterior en cuanto al signo 
de N(s), por lo que redefinimos la curvatura de modo que x"(s) = n(s)N(s). 
Notemos que ahora el vector normal está definido incluso en los puntos donde 
la curvatura es nula. 

Con el convenio usual de orientación, el vector N apunta hacia la izquierda si 
miramos en el sentido de T. La curvatura es positiva si cuando la curva avanza 
se desvía hacia la izquierda y negativa si se desvía hacia la derecha (o nula si no 
se desvía). Diremos que la curva gira en sentido positivo o en sentido negativo 
según el signo de su curvatura. El sentido de giro positivo es el contrario a las 
agujas del reloj. De este modo, la orientación distingue los dos sentidos de giro. 



Vector binormal y torsión La teoría de curvas en K 3 se completa con la 
introducción del vector binormal y la torsión. El vector binormal de una curva 
x(s) tres veces derivable en un punto de curvatura no nula es B(s) = T(s)f\N(s). 
La base formada por los vectores (T(s), N(s), B(s)) se conoce como triedro de 
Frenet. Definimos la torsión de x en cada punto como r(s) = —N'(s)B(s). 

Para interpretar la torsión empezaremos por determinar N'. Digamos que 

N' = aT+bN + cB. (4.5) 

Multiplicando por T obtenemos a = N'T, y como TN = 0, derivando resulta 
T'N + TN' = 0, luego a = -T'N = -kNN = -k. 

Si multiplicamos (4.5) por N resulta b = N'N, pero al derivar en NN = 1 
resulta 2NN' = 0, luego 6 = 0. Por último, es claro que c = N'B = — t. Por 
consiguiente 

N' = -kT-tB. 

La misma técnica nos da una expresión para B' . Sea B' = aT + bN + cB. 
Multiplicando por T obtenemos a = TB' , pero de BT — 0 se concluye que 
TB' = -T'B = -kNB = 0. Similarmente b = NB' = -N'B = r. Al 
multiplicar por B llegamos a c = B'B = 0, pues BB = 1. 

Tenemos así las llamadas fórmulas de Frenet: 

T' = kN, 

N' = -kT - tB, 

B' = tN. 
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Vemos que si r = 0 en todo punto entonces B es constante, luego (xB)' — 
x'B = TB = 0 implica que xB es constante, luego x está contenido en un plano 
perpendicular a B, luego la curva es plana. El recíproco es claro. Así pues, 
las curvas sin torsión son exactamente las curvas planas. En general, el plano 
x(s) + (T(s),N(s)) recibe el nombre de plano osculante a la curva. Si la curva es 
plana, su plano osculante es el mismo en todo punto, y la curva está contenida 
en él. En caso contrario, puede probarse que el plano osculante en un punto es 
el plano más próximo a la curva en un entorno del punto. La tercera fórmula 
de Frenet muestra que la torsión mide la rapidez con que varía B o, lo que es 
lo mismo, la rapidez con la que varía el plano osculante. 

A continuación derivamos una fórmula explícita para la torsión de una curva. 
Si x está parametrizada por la longitud de arco, entonces 

r" T>" K — -r" k' 

N=—, N'= X 9 — . 

K K 

luego, 

1 (V A r"W" <r' r" r'") 

t= -BN' = (TAN)N' = --(x'Ax")N' = — 1 XAX > X - ' 

K 

donde (i¿, w, w) = u(vAw) es el producto mixto de vectores. Si la parametrización 
no es la natural tenemos evidentemente 

x 1 A x" 

B 



\\x' Ax"\\ ' 

y un cálculo rutinario nos lleva de la expresión que tenemos para r(s) a 

_ (x',x",x"') 
\\x' A x"\\ 2 



Ejercicio: Calcular la curvatura y la torsión de la hélice (r sení, r cosí, kt). 

Para acabar probaremos que la curvatura y la torsión determinan una curva 
salvo por su posición en el espacio. 

Teorema 4.23 Sean x,x : I — > M 3 dos curvas con las mismas funciones k 
y t. Entonces existe una isometría f : R 3 — > R 3 tal que x(s) — /(í(s)) para 
todo s£Í. 

DEMOSTRACIÓN: Es fácil comprobar que los vectores del triedro de Frenet, 
así como la curvatura y la torsión se conservan por isometrías, en el sentido de 
que, por ejemplo, si / es una isometría se cumple T xo f(s) = T x o /, donde / es 
la isometría lineal asociada a /. Igualmente n xo f(s) = k(s), etc. 

Sea s 0 € /. Aplicando una isometría a x podemos exigir que x(so) = x(sq), 
T(s 0 ) = f (s 0 ), N(s 0 ) = Ñ(s 0 ), B(s 0 ) = B(a 0 ), k(s 0 ) = «(«o), r(« 0 ) = f(« 0 )- 
Probaremos que en estas condiciones x = x. 
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Es claro que 



ld_ 
2ds 



(\\T-f\\ 2 + \\N-Ñ\\ 2 + \\B-B\\ 2 ) 



= (T — T){T' - T') + (N — N)(N' - N') + (B - B)(B' - B') 
Aplicando las fórmulas de Frenet queda 

k{T-T){N-Ñ)-k{N-Ñ){T-T)-t{N-Ñ){B-B)+t{B-B){N-Ñ) = 0, 

luego T = T,N = Ñ,B = B, pues las diferencias son constantes y se anulan 
en s 0 . La primera igualdad es i' = i', y como ambas funciones coinciden en s 0 
ha de ser x = x. m 

Como consecuencia, si una curva plana tiene curvatura constante k, entonces 
es un arco de circunferencia de radio r = 1/k, pues su curvatura y su torsión 
(nula) coinciden con las de la circunferencia. Las curvas de curvatura nula son 
las rectas. 

Sistemas de referencia no inerciales A la hora de medir la posición de un 
objeto físico es necesario tomar a otro como referencia. Aunque en la práctica 
las coordenadas cartesianas no son siempre las más apropiadas, teóricamente 
podemos imaginar que seleccionamos un objeto rígido en el que marcamos cuatro 
puntos a los que asignamos las coordenadas (0,0,0), (1,0,0), (0,1,0), (0,0,1) 
y con respecto a ellos determinamos la posición de cualquier otro punto del 
espacio. 

Podría parecer conveniente exigir que el objeto mediante el cual definimos 
nuestro sistema de referencia esté en reposo, para evitar que las coordenadas de 
un cuerpo varíen por causa del movimiento del sistema de referencia y no por 
su propio movimiento. Sin embargo la Tierra, el Sol y las estrellas se mueven 
por el espacio, luego no tenemos a nuestra disposición ningún objeto del que 
podamos garantizar que está en reposo. Más aún, la física enseña que el requisito 
mismo no tiene sentido, pues no existe forma de dar sentido al concepto de 
"reposo absoluto" , sino que el concepto de movimiento es esencialmente relativo 
al sistema de referencia que adoptemos. 

Pese a ello, no todos los sistemas de referencia son equivalentes. Una clase 
especial de ellos la forman los determinados por objetos libres de toda influencia 
externa. Uno de los postulados básicos de la física es que si dos objetos están 
libres de toda influencia externa, su movimiento relativo será uniforme, es decir, 
al tomar como referencia a uno de ellos el otro se moverá (en línea recta) con 
velocidad constante, tal vez nula. A los sistemas de referencia en estas condicio- 
nes se les llama inerciales, de modo que la primera ley de Newton, de la que ya 
hemos hablado, afirma en realidad que la velocidad de un cuerpo libre de toda 
influencia exterior medida desde un sistema de referencia inercial permanece 
constante. 

Esta ley no es aplicable a sistemas no inerciales. Por ejemplo, enseguida 
justificaremos que un tren que se mueve con velocidad constante puede ser 
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considerado como un sistema de referencia inercial, pero en el momento en que 
el tren acelera o frena deja de serlo. En efecto, imaginemos una esfera en reposo 
sobre el pasillo del tren. Visto desde la tierra, tanto el tren como la esfera están 
moviéndose a la misma velocidad. Cuando el tren frena, los frenos actúan sobre 
él haciéndolo parar, pero no actúan sobre la esfera, que sigue moviéndose a la 
misma velocidad. Desde un sistema de referencia determinado por el tren, la 
esfera en reposo pasa a moverse hacia delante sin que nada haya influido sobre 
ella. Esto es una violación de la primera ley de Newton. 

La Tierra no es un sistema de referencia inercial a causa de sus movimientos 
de rotación y traslación. No obstante, la traslación alrededor del Sol sigue una 
órbita de radio tan grande que localmente es casi recta, y las consecuencias de 
este movimiento son inapreciables. En cuanto a la rotación, sus efectos sí son 
detectables mediante experimentos físicos que falsean la ley de Newton, pero 
en muchas ocasiones también resulta despreciable (una bola encima de una 
mesa nunca empieza a moverse sola como en el tren) . Un sistema de referencia 
determinado por un objeto que se mueva a velocidad constante respecto a un 
sistema de referencia inercial cumple igualmente la ley de Newton y las leyes 
restantes de la dinámica, por lo que puede ser considerado inercial. Es el caso 
del tren que comentábamos antes. Lo que sucede es que aunque el tren está 
sometido a la acción de su motor, ésta se emplea únicamente en contrarrestar 
las fuerzas de rozamiento que se oponen a su avance, con lo que las dos acciones 
que éste experimenta se cancelan mutuamente, y el resultado es el mismo que 
si ninguna fuerza actuara sobre él. 

Con más detalle: los cuerpos actúan unos sobre otros alterando su estado 
de movimiento. Por ejemplo, si dejamos en el aire un objeto en reposo éste no 
permanecerá en tal estado, sino que caerá, y esto no es una violación de la ley 
de Newton. Lo que sucede es que el cuerpo no está libre de acciones externas, 
sino que sufre la acción de la gravedad terrestre. La segunda ley de Newton 
afirma que la acción que un cuerpo ejerce sobre otro se traduce siempre en 
una aceleración sobre el mismo. Más detalladamente, a dicha acción se le puede 
asociar un vector llamado fuerza, de modo que si sumamos todas las fuerzas que 
produce sobre un cuerpo cada uno de los cuerpos externos que le influyen, el 
vector fuerza resultante es el producto de una constante, llamada masa inercial 
del cuerpo, por la aceleración que experimenta. 

Ahora vamos a estudiar qué consecuencias tiene la rotación de la tierra en 
el movimiento de los objetos. En general, consideremos los vectores 

i = (eos u>t, sen ujt, 0), j = (— sen ujt, eos cut, 0), k= (0,0,1). 

En cada instante t, estos vectores forman una base ortonormal positivamente 
orientada (notar que k = i A j). Podemos suponer que hemos fijado un sistema 
de referencia inercial con origen en el centro de la tierra y que k apunta hacia el 
norte. Si u> es la velocidad angular de la Tierra, es decir, n/12 radianes por hora, 
entonces los tres vectores se mueven con la Tierra, y están en reposo respecto a 
ella. 

Consideremos un objeto de masa m que se mueve según la trayectoria x(t). 
Esto significa que la fuerza resultante que actúa sobre él en cada instante t es 
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F = mx". Expresemos 

x(t) = x r (t)i(t) + y r (t)j(t) + z r (t)k. 

Así, (x r , y r , z r) son las coordenadas del móvil respecto a un sistema de refe- 
rencia relativo a la Tierra. Derivemos: 

x' = V r — üoy r i + Lüx r j = V r + íük A x, 

donde V r = x' r i + y' r j + z' r k es la velocidad relativa del móvil. Volvemos a derivar: 

x" = A r + Lük A V r + A x' = A r + 2ujk AV r + uj 2 k A (fc A x), 

donde A r = x"i + y"j + z"k es la aceleración relativa. Multiplicamos por la 
masa m del móvil y despejamos 

vnA r = F + 2mu)V r A k + muj 2 (k A a;) A fc. 

Esta es la expresión de la segunda ley de Newton en un sistema de referencia 
en rotación con velocidad angular constante. La masa de un objeto por la 
aceleración que experimenta no es la resultante de las fuerzas que actúan sobre 
el objeto, sino la suma de esta resultante más dos "fuerzas ficticias", llamadas 
fuerza centrífuga y fuerza de Coriolis, dadas por 

= muj 2 (k A x) A fc, 
= 2muV r A fc. 

Se las llama fuerzas ficticias (o inerciales) porque se comportan formalmente 
como fuerzas que hay que sumar a las demás, pero que no se corresponden con 
ninguna acción de ningún objeto sobre el móvil (como en el caso de la esfera 
que se mueve sola). 

Si el móvil se encuentra en la superficie de la tierra a una latitud a (el ángulo 
que forma con el ecuador) entonces la fuerza centrífuga tiene la dirección y 
el sentido de x, es decir, apunta hacia arriba (recordemos que el origen de 
coordenadas está en el centro de la Tierra) y su módulo es meo 2 Reos a, donde 
R es el radio de la Tierra, luego es nula en los polos y máxima en el ecuador. 

Para hacernos una idea de su intensidad, sobre un cuerpo de lkg de masa 
actúa una fuerza centrífuga de 

1 • (7,29 • 1CT 5 ) 2 6,3 • 10 6 « 0,03N, 

mientras 1 que su peso es de 9,87V, unas 326 veces mayor. Por consiguiente la 
fuerza centrífuga es generalmente despreciable. Si la Tierra girara mucho más 
rápido los cuerpos pesarían menos por causa de esta fuerza y llegado a un punto 
podrían salir despedidos hacia el cielo. 

La fuerza de Coriolis sólo actúa sobre cuerpos en movimiento respecto a la 
Tierra. Por ejemplo, si un cuerpo cae su velocidad V r apunta al centro de la 

x La unidad de fuerza es el Newton. Un Newton es la fuerza que aplicada a un cuerpo de 
lKg de masa le produce una aceleración de lm/s 2 . 
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Tierra y V r A k apunta hacia el este, por lo que los cuerpos que caen sufren una 
desviación hacia el este, nula en los polos y máxima en el ecuador. 

Si el movimiento se realiza sobre la superficie de la Tierra observamos que k 
apunta hacia el exterior de la misma en el hemisferio norte y hacia el interior en 
el hemisferio sur, por lo que V r A k apunta hacia la derecha de V r en el hemisferio 
norte y hacia la izquierda en el hemisferio sur. Si descomponemos esta fuerza 
en dos vectores, uno en la dirección del centro de la Tierra y otro tangente a la 
misma, la gravedad hace inadvertible la primera componente, pero la segunda 
es apreciable. Esta es nula en el ecuador y máxima en los polos. Puesto que se 
dirige siempre hacia el mismo lado, la fuerza de Coriolis hace girar los objetos, 
y se pone de manifiesto en los líquidos y gases, por ejemplo, el agua que cae por 
un desagüe gira en sentido horario en el hemisferio norte, en sentido antihorario 
en el hemisferio sur y no gira en las proximidades del ecuador. También puede 
apreciarse su efecto sobre un péndulo suficientemente largo y pesado (péndulo 
de Foucault). 

*Longitud de arcos no euclídeos Veamos ahora cómo se generalizan los 
resultados sobre longitud de arcos a las geometrías hiperbólica y elíptica. Co- 
mencemos por la primera. Consideremos un arco X(t) = (x(t),y(t), z(t)^ en 
el plano proyectivo P 2 (IR) contenido en el interior de una cónica de ecuación 
f(X, X) = 0. Llamamos s(t) a la longitud de arco que queremos definir. Lo 
haremos determinando su derivada como en el caso euclídeo. La idea central es 
que si d representa la distancia hiperbólica entre dos puntos, entonces 

s(t + h)- s(t) d(X(t + h),X(t)) 
~h ~ \hT ~~ ' 

y la aproximación será mejor cuanto menor sea h, pues si X es derivable se parece 
a una recta alrededor de X(t), luego el límite cuando h — ► 0 en el cociente de la 
izquierda nos dará la derivada de s. Para calcular este límite usaremos que 

senh v 
hm = 1 

v^O v 



y que 



Así pues, 



senhd(X,y) 



l p(X,Y)-f(X,X)f(Y,Y) 
f(X,X)f(Y,Y) 



d l =]ím l_ f 2 (gWjjfff + h )) - f(X(t),X(t))f(X(t + h),X(t + h)) 
dt h^o\h\\] f(X(t),X(t))f(X(t + h),X(t + h)) 

Sea X(t + h) = X(t) + AX(t,h). Usando que / es bilineal la expresión 
anterior se simplifica: 



ds Km 1 / p(X,AX)-f(X,X)f(AX,AX) 



dt " \h\ V f(X, X) (/(X, X) + 2f(X, AX) + f(AX, Al)) 
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¿™ V W, X) (f(X, X) + 2f(X, Al) + /(Al, AX)) 
l f 2 (X,X')-f(X,X)f(X' 7 X>) 

V f 2 (x,x) 

Vamos a particularizar esta fórmula para el caso del plano de Klein, es decir, 
tomando como / la circunferencia unidad f(Xi,X2) = z\Zi — x\Xi — 2/12/2 y el 
arco de la forma X(t) = (x(t),y(t), l), de modo que X'(t) = (x'(t), y'(t), 0) . El 
resultado es: 

fds\ 2 = (xx' -yy') 2 + (í-x 2 - y 2 ){x' 2 + y 12 ) 
\dt) ' ' " íl x 2 //-':- " ' 

Operando y multiplicando por di 2 obtenemos una expresión para el elemento 
de longitud hiperbólica en el plano de Klein: 

2 dx 2 + dy 2 — (xdy — y dx) 2 
(1 — x 2 — y 2 ) 2 

que ha de entenderse como una ecuación funcional, para cada punto t, entre 
la diferencial de la longitud de arco ds(t) y las diferenciales dx(t), dy(t) de las 
funciones coordenadas del arco. Formalmente, si X : [a,b] — > M. 2 , definimos 
s(t) como la integral desde a hasta t de la raíz cuadrada del miembro derecho 
de la igualdad anterior, con lo que obtenemos una función que satisface dicha 
relación. Informalmente ds así calculado es el incremento infinitesimal que ex- 
perimenta la longitud de arco cuando el parámetro se incrementa en dt y la 
integral de ds nos da el incremento completo de la longitud de arco entre dos 
límites dados. 

Observemos que la longitud hiperbólica es invariante por isometrías. En 
efecto, a cada arco X : [o, b] — > R 2 le hemos asociado la función s determinada 
por s(a) = 0 y 

ds _ d(X(t+h),X(t)) 
dt h^a \h\ 

y es obvio que el miembro derecho es invariante por isometrías. 

La expresión que hemos obtenido no es muy manejable, y las integrales a que 
da lugar resultan complicadas. Las coordenadas polares nos dan una expresión 
más sencilla. Si diferenciamos (x,y) = (r eos 8, r sen 6) y sustituimos en la 
expresión de ds obtenemos 

ds2 = ñ^Y + —2 d92 - 



Si un punto se encuentra a una distancia hiperbólica p del centro del plano 
de Klein, la distancia euclídea es r = tanhp. Al diferenciar esta relación y 
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sustituir en la expresión anterior obtenemos el elemento de longitud hiperbólico 
en coordenadas polares hiperbólicas, que resulta ser 

ds 2 = dp 2 + senh 2 pd6 2 , (4.6) 

relación análoga a (4.3). 

Por ejemplo, consideremos una circunferencia cuyo centro coincida con el del 
plano de Klein y de radio (hiperbólico) r. Entonces su longitud hiperbólica es 



L 



2it 

senh rdO = 2iT senh r. 

o 



Observemos que si el radio es pequeño la longitud es aproximadamente la 
euclídea 2?rr. 

La fórmula (4.6) es intrínseca, en el sentido de que las coordenadas (p, 6) de 
un punto P representan la distancia hiperbólica de P a un punto fijo O y el 
ángulo de la semirrecta OP con una semirrecta fija de origen O, y nada de esto 
depende del plano de Klein. Por lo tanto la fórmula ha de ser válida también 
en el círculo de Poincaré. La relación entre la distancia euclídea r y la distancia 
hiperbólica p de un punto P al punto 0 en el círculo de Poincaré es 

. l + r 

P = log- , 

1 — r 

de donde 

2r , 2dr 

senhp=- ^ d P=i 2' 

1 — r ¿ 1 — r z 

Por consiguiente, el elemento de longitud en coordenadas polares (euclídeas) 
en el círculo de Poincaré resulta ser 

„ Vdr 2 + r 2 d6 2 

ds = 2 . 

1 — r z 

Según (4.3), el numerador es el elemento de longitud euclídea en coordenadas 
polares. Si usamos la notación compleja para el arco z(t) = x{t) + iy(t) y 
llamamos \dz\ = \J dx 2 + dy 2 al elemento de longitud euclídea, entonces tenemos 

d.s= 2 M 



i - Ul 2 ' 



Esta expresión diferencial muestra la naturaleza de la distancia hiperbólica 
mucho más claramente que la fórmula de la distancia entre dos puntos. Vemos 
que la distancia hiperbólica es infinitesimalmente la euclídea dividida entre el 
factor más simple posible que hace que se "dilate" al acercarnos al borde del 
círculo de radio 1, de modo que las pequeñas distancias euclídeas son cada vez 
más grandes desde el punto de vista hiperbólico. La expresión también es muy 
clara en el semiplano de Poincaré. La transformación circular 

iw + 1 

z = r 

w + i 
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convierte el círculo \z\ < 1 en el semiplano Imw > 0. Se comprueba 2 que 

-2dw 2\dw\ 2 Ay 

dz =l —^2' \ dz \ = i , — T2 ' 1_ H " 



(iu + ¿) 2 ' |w + i| 2 ' |u; + í| 2 ' 

De todo esto resulta 

ds=^, 

y 

es decir, que el elemento de longitud hiperbólico en el semiplano de Poincaré es 
el euclídeo dividido entre la parte imaginaria, de modo que cuando ésta tiende 
a 0 las longitudes tienden a infinito. 

Todos los argumentos anteriores valen igualmente para la geometría elíptica, 
partiendo ahora de una cónica imaginaria f(X ll X 2 ). La única diferencia es un 
signo en la fórmula 



send(X,Y) 



' -p(X,Y) + f(X,X)f(Y,Y) 
f(X,X)f(Y,Y) 



debido a que la relación fundamental entre los senos y cosenos circulares difiere 
en un signo respecto a la hiperbólica. Como consecuencia llegamos a 

ds\ 2 _ -f 2 {X,X') + .f{X 1 X)f{X',X') 



dtj f 2 (X,X) 

En el modelo esférico, o sea, si suponemos f(Xi, X 2 ) = x\x 2 + y\yi + z\z 2 
y f(X,X) = 1, al derivar respecto de t queda f(X,X') = 0, y la expresión se 
reduce a 



<is x 2 
di 



f{X' : X')=x' ¿ + y" + z'\ 



es decir, 

ds 2 = dx 2 + dy 2 + dz 2 , 

luego la longitud elíptica de un arco contenido en la esfera unitaria coincide con 
su longitud euclídea. En coordenadas polares elípticas: 

(x 7 y 7 z) = (sen p eos 9, eos p sen 0, sen 6), 

la expresión es 

ds 2 = dp 2 + sen 2 p dd. 
La longitud de una circunferencia elíptica de radio (elíptico) r es 27rsenr. 



2 La teoría de funciones de variable compleja justifica que es lícito calcular dz derivando 
la expresión anterior como si w fuera una variable real y tratando las constantes imaginarias 
como constantes reales. Nosotros no hemos probado esto, por lo que el lector puede, si lo 
desea, hacer los cálculos en términos de las dos variables reales x, y, pero está avisado de que 
llegará al mismo resultado. 
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Introducción a las 
variedades diferenciables 

En este capítulo aplicaremos el cálculo diferencial al estudio de las superfi- 
cies. Si bien todos los ejemplos que consideraremos serán bidimensionales, la 
mayor parte de la teoría la desarrollaremos sobre un concepto general de "su- 
perficie de n dimensiones" . La idea básica es que una superficie es un espacio 
topológico que localmente se parece a un plano. El ejemplo típico es la superficie 
terrestre: tenemos que alejarnos mucho de ella para darnos cuenta de que no 
es plana, sino esférica. Una definición topológica que recoja estas ideas sería la 
siguiente: 

Un subconjunto S de IR™ es una superficie si para cada punto p € S 
existe un entorno V de p, un abierto U en IR 2 y un homeomorfismo 

X:U — >vns. 

Es decir, S es una superficie si alrededor de cada punto es homeomorfa a un 
abierto de IR 2 . Notar que no pedimos que S sea homeomorfa a un abierto de 
R 2 , sino sólo que lo sea alrededor de cada punto. Basta pensar en una esfera 
para comprender la importancia de este hecho. Una esfera no es homeomorfa a 
un abierto de IR 2 , pero un pequeño trozo de esfera es como un trozo de plano 
abombado, homeomorfo a un trozo de plano "llano". Sin embargo nosotros 
estamos interesados en superficies diferenciables, en el sentido de que se parezcan 
a planos afines alrededor de cada punto. Podría pensarse que para conseguir esto 
bastaría exigir que el homeomorfismo X sea diferenciable, pero no es así. Por 
ejemplo, pensemos en X(u,v) = (u 3 ,v, |u 3 |). La aplicación X es diferenciable, 
y es un homeomorfismo entre IR 2 y un conjunto S C IR 3 cuya forma es la de 
una hoja de papel doblada por la mitad. Alrededor de los puntos de la forma 
(0, v, 0) no se parece a ningún plano, sino que 
tiene un "pico" . Si la Tierra tuviera esta forma 
no necesitaríamos alejarnos de ella para darnos 
cuenta de que estaría "doblada" . 
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La razón es que gLY(0, b) — (Q,dv(0,b),Q), de modo que alrededor de un 
punto (0,6) la función X se parece a la aplicación afín f(u,v) = (0, v,0), cuya 
imagen es la recta x = z = 0. Así pues, aunque topológicamente la imagen de 
X es homeomorfa a un plano, desde el punto de vista del cálculo diferencial la 
imagen de X alrededor de un punto (0, y, 0) se parece a la recta x = z = 0, y no 
a un plano. Para evitar esto hemos de exigir que la imagen de dX(u, v) sea un 
plano y no una recta. Esto es tanto como decir que la matriz jacobiana tenga 
rango 2. 

5.1 Variedades 

Definición 5.1 Un conjunto S C R m es una variedad diferenciable de di- 
mensión n < ra y de clase C q si para cada punto p € S existe un entorno 
V de p, un abierto U en K" y una función X : U — > M m de clase C q de modo 
que el rango de la matriz JX sea igual a n en todo punto y X : U — > S ílV 
sea un homeomorfismo. Una aplicación X en estas condiciones se llama carta 
de S alrededor de p. 

En lo sucesivo supondremos que las variedades con las que trabajamos son de 
clase C q para un q suficientemente grande como para que existan las derivadas 
que consideremos (y sean continuas). Rara vez nos hará falta suponer q > 3, 
aunque de hecho todos los ejemplos que consideraremos serán de clase C°°. 

La palabra "carta" hay que entenderla en el sentido de "mapa" . En efecto, 
podemos pensar en U como un mapa "plano" de una región de S, y la aplicación 
X es la que hace corresponder cada punto del mapa con el punto real que 
representa. 

'(3) — q " 

Alternativamente, podemos pensar en A -1 como una aplicación que asigna 
a cada punto p & S ÍlV unas coordenadas x = (x\, . . . , x n ) G U C K™, de forma 
análoga a los sistemas de coordenadas en un espacio afín. 1 Dentro de poco 
será equivalente trabajar con cartas o con sistemas de coordenadas, pero por el 
momento podemos decir que las cartas son diferenciables y en cambio no tiene 
sentido decir que las funciones coordenadas lo sean, pues no están definidas 
sobre abiertos de R m . 

1 Etimológicamente, una "variedad" no es más que un conjunto cuyos elementos vienen 
determinados por "varias" coordenadas. En los resultados generales llamaremos xi , . . . , x n 
a las coordenadas para marcar la analogía con R n , aunque en el caso de curvas seguiremos 
usando la variable í (o s si la parametrización es la natural) y en el caso de superficies ScR 3 
usaremos x, y, z para las coordenadas en R 3 y u, v para las coordenadas en S. 
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Ejemplo Todo abierto U en M™ es una variedad diferenciable de dimensión n 
y clase C°°. Basta tomar como carta la identidad en U. De este modo, todos 
los resultados sobre variedades valen en particular para R n y sus abiertos. ■ 

Ejercicio: Refinar el argumento del teorema 2.21 para concluir que dos puntos cua- 
lesquiera de una variedad conexa S de clase C q pueden ser unidos por un arco de clase 
C q contenido en S. 

El teorema siguiente proporciona una clase importante de variedades dife- 
renciables, pues a continuación vemos que toda variedad es localmente de este 
tipo. 

Teorema 5.2 Sea f : U C R™ — > R fe una aplicación de clase C q sobre un 
abierto U y X :U — > R™ +fe la aplicación dada por X(x) = [x, f(x)) . Entonces 
X[U] es una variedad diferenciable de dimensión n y clase C q . 

Demostración: Basta observar que X es obviamente un homeomorfismo 
en su imagen (su inversa es una proyección) y JX(x) contiene una submatriz 
de orden n igual a la identidad, luego su rango es n. La definición se satisface 
tomando V = R n+k . m 

Observar que X[U] es la gráfica de /, luego el teorema anterior afirma que 
la gráfica de una función diferenciable es siempre una variedad diferenciable. 
Ahora veamos que todo punto de una variedad diferenciable tiene un entorno 
en el que la variedad es la gráfica de una función. 

Teorema 5.3 Sea S C R n+fe una variedad de clase C q y de dimensión n. Sea 
p G S. Entonces existe un entorno V de p, un abierto U en IR" y una función 
f : U — > R k de clase C q de modo que la aplicación X : U — > R n+k dada por 
X(x) = [x, f(x)) es una carta alrededor de p. 

En realidad hemos de entender que las coordenadas de a; y f(x) se intercalan 
en un cierto orden que no podemos elegir, tal y como muestra la prueba. 

DEMOSTRACIÓN: Sea Y : W — > R n+k una carta alrededor de p. Sea V un 
entorno de p tal que Y : W — > S ílV sea un homeomorfismo. Sea t 0 G W 
el vector de coordenadas de p, es decir, Y(t 0 ) = p. Puesto que JY(to) tiene 
rango n, reordenando las funciones coordenadas de Y podemos suponer que el 
determinante formado por las derivadas parciales de las n primeras es no nulo. 
Digamos que Y(t) = (Y^t) ,Y 2 (t)) , donde |JYi(í 0 )| ¿ 0. Sea Pl = Yi(í 0 ). 

Por el teorema de inyectividad local y el teorema de la función inversa, existe 
un entorno abierto G C W de ío tal que Y\ es inyectiva en G, Y\[G] = U es 
abierto en R™ y la función Y{~ : U — > G es de clase C q . 

El conjunto Y[G] es un entorno abierto de p en SílV, luego existe un entorno 
abierto V de p en R n+k tal que Y[G] = S C\V C\V . Cambiando V por V n V 
podemos suponer que V C V y que Y[G] = S íl V . 

De este modo, cada punto p G SílV está determinado por sus coordenadas 
t G G, las cuales a su vez están determinadas por x = Y\(t) G U, con la particu- 
laridad de que x es el vector de las primeras componentes de p. Concretamente 
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p está formado por x y f(x) = l^fVi 1 (x)). La función / es de clase C q en U. 
De este modo, si x € U y t = Y^ (x) € G, tenemos que 

x(x) = (x, f(x)) = (F!(í),y 2 (í)) = f(í) esnv'. 

Recíprocamente, si (x,y) € SílV, entonces x — Yi(t), y = Y 2 (t) para 
un cierto t € G, luego (x,y) = (x, /(x)) = X(x). En definitiva tenemos que 
X : U — > Sn V es biyectiva. Su inversa es la proyección en las primeras 
componentes, luego X es un homeomorfismo. ■ 

En las condiciones de la prueba anterior, sea 7r : W 11 — > IR™ la proyección 
en las n primeras componentes y g : V — > G la aplicación dada por g(x) = 
Y^ 1 (n(x)) . Notemos que si x G V entonces tt(x) G U, luego g está bien definida 
y es de clase C q . Si t € G entonces 

fl (y(t)) = ?(yi(í),r 2 (¿)) = yf^nw) = t, 

luego (F|g) _1 es la restricción a V fl 5 de .9. Con esto hemos probado: 

Teorema 5.4 Sea F : U — > 5* C M m wna caria de «na variedad diferenciable 
de dimensión n y clase C q . Para cada punto t € U existe un entorno G C U 
de t, un entorno V de Y (i) y una aplicación g : V — > G de clase C q tal que 
(Ylo)- 1 = g\ vns . 

De aquí se sigue una propiedad fundamental de las cartas: 

Teorema 5.5 Sea S C IR" 1 una variedad diferenciable de dimensión n y de 
clase C q . Sea p e S y X : U — * S n V, Y : U' — * S H V dos cartas alrededor 
de p. Sean Vq = V fl V , U a = X _1 [Vó], í7q = F _1 [Vo]. Entonces la aplicación 
X o Y^ 1 : Uo — > C/q es biyectiva, de clase C q y con determinante jacobiano no 
nulo, con lo que su inversa es también de clase C q . 

DEMOSTRACIÓN: Si t e Uo, por el teorema anterior existe una función g de 
clase C q definida en un entorno de X(t) de modo que X o Y^ 1 = X o g (en 
un entorno de t), luego X o Y^ 1 es de clase C q en un entorno de t, luego en 
todo Uo- Lo mismo vale para su inversa Y o X^ 1 , luego la regla de la cadena 
nos da que sus diferenciales son mutuamente inversas, luego los determinantes 
jacobianos son no nulos. ■ 

Veremos ahora otro ejemplo importante de variedades diferenciables. Pri- 
meramente consideraremos el caso lineal al cual generaliza. 

Ejemplo Una variedad afín de dimensión n en M. m es también una variedad 
diferenciable de la misma dimensión y de clase G°°. En efecto, una tal variedad 
está formada por los puntos que satisfacen un sistema de m — n ecuaciones 
lineales lincalmcntc independientes. Esto implica que la matriz de coeficientes 
del sistema tiene un determinante de orden ra-nno nulo, luego agrupando 
adecuadamente las variables podemos expresar el sistema como xA + yB = c, 
donde x G R n , y G R m ~ n , \B\ ^ 0, luego podemos despejar y = f(x) = 
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(c — xA)B~ 1 , donde la función / es obviamente de clase C°° . Esto significa que 
la variedad lineal está formada por los puntos (x,y) tales que y = f(x), luego 
es la gráfica de / y por consiguiente es una variedad de clase C°° . ■ 

Ahora probamos que las soluciones de un sistema de k = m — n ecuaciones di- 
ferenciabas con m incógnitas constituyen una variedad de dimensión n supuesto 
que se cumpla una condición de independencia similar a la independencia lineal 
que exigíamos en el ejemplo anterior. 

Definición 5.6 Si / : A C R n+k — > R k es diferenciable en (x, y) G A, donde 
x e K™, y e R k , definimos 

D n+ ih(x,y) ■■■ D n+1 f k (x,y) 



D n+k fi(x,y) ••• D n+k f k (x,y) 



d(yi---y k ) 



Teorema 5.7 (Teorema de la función implícita) Consideremos una apli- 
cación f : A C M. n+k — > M. k de clase C q en el abierto A, con q > 1. Sea 
(x°,y°) G A tal que f(x°,y°) = 0 y supongamos que 



d(fi---fk) . 
9(yi ■■■yk) 



(x ü ,y°)^o. 



Entonces existen abiertos V C A, U C W 1 de modo que (x°,y°) G A, x° € U y 
una función g : U — > R k de clase C q tal que 

{(x,y) e V | f(x,y) = 0} = {(a;, y) G R n+k \ x € U, y = g(x)}. 

DEMOSTRACIÓN: Sea F : A — > R n+k la función F(x,y) = (x,f(x,y)). Sus 
funciones coordenadas son las proyecciones en las componentes de R™ más las 
funciones coordenadas de /, luego F es de clase C q . Su determinante jacobiano 
es 



1 ••• 0 D.f^y) 

0 ••• 1 D n h{x,y) 
0 ••• 0 D n+1 h{x,y) 

0 ••• 0 D n+k fi(x,y) 
que claramente coincide (salvo signo) con 

d(h---fk) 
9(yi ■■■yk) 



Dif k (x,y) 

D„fk{x,y) 
D n+1 f k (x,y) 

D n+k f k (x,y) 



(x,y). 



Así | Jf(x°, y°) \ ^ 0. Por el teorema de inyectividad local existe un entorno 
V de (a; 0 , y°) donde F es inyectiva y su determinante jacobiano no se anula. Por 
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el teorema de la función inversa tenemos que W = F[V] es abierto en W l+k y 
la función G = F~ x : W — > V es de clase C q . 

Podemos expresar G(x,y) = (G\(x,y),G2(x,y)) . Claramente G\ y G2 son 
ambas de clase C q . Si (x,y) € W, entonces 

(x,y)=F(G(x,y))=F(G 1 (x,y),G 2 (x,y)) = (Gfay), f(G(x,y))), 

luego G\(x,y) = x, con lo que en general G(x,y) = (x,G2(x,y)). 

Definimos U = {x G IR™ | (a;, 0) € W}. Es claro que se trata de un abierto. 
Además, F(x°,y°) = (x°,0) € W, luego x" € U. Definimos g : U — > R k 
mediante g(x) = G 2 (x 7 0). Claramente g es de clase C q . 

Tomemos ahora x € U e y = g(x). Hemos de probar que (x,y) € V y 
f(x,y) = 0. En efecto, por definición de U es (x,0) € W, luego G(x,0) € V, 
pero 

G(x,0) = (x,G 2 (x,0)) = (x,g(x)) - (x,y). 
Además (x,0) = F(G(x,Q)) = F(x,y) = (x,f(x,y)), luego f(x,y) = 0. 
Recíprocamente, si (x, y) € V y f(x, y) = 0 entonces 

F{x,y) = (x,f(x,y)) = (x,0) € W, 

luego x & U y (x,y) = G(F(x,y)) = G(x,0) = (x,G 2 {x,0)) = (x,g(x)), con lo 
que g(x) =y. m 

Lo que afirma este teorema es que si S — {x € R n+k \ f(x) = 0} es un 
conjunto determinado por un sistema de k ecuaciones de clase C q y p € S 
cumple la hipótesis entonces V íl S = X[U], donde X(x) = (x,g(x)), de donde 
se sigue que X cumple las condiciones para ser una carta de S alrededor de p. 
Si la hipótesis se cumple en todo punto entonces S es una variedad diferenciable 
de dimensión n. 

Por ejemplo, si f(x,y,z) = x 2 + y 2 + z 2 — r 2 , entonces el conjunto S es 
una esfera. Para comprobar que se trata de una superficie de clase C°° basta 
comprobar que en cada punto al menos una de las derivadas 

df n df n df n 

7T = 2x > -JT = 2 y> 7T = 2z ' 
ox oy oz 

es no nula, pero las tres sólo se anulan simultáneamente en (0,0,0), que no es 
un punto de S, luego, efectivamente, la esfera es una superficie diferenciable. 

Es importante observar que la derivada que no se anula no siempre es la 
misma. Por ejemplo, en el polo norte (0, 0, r) la única derivada que no se anula 
es la de z, luego en un entorno podemos expresar z como función z(x, y). Con- 
cretamente, z = \/r 2 — x 2 — y 2 . Similarmente, la porción de esfera alrededor 
del polo sur es la gráfica de la función z = — r 2 — x 2 — y 2 . En cambio, alrede- 
dor de (r, 0, 0) la esfera no es la gráfica de ninguna función z(x, y). Es fácil ver 
que dado cualquier entorno U de (r, 0, 0) y cualquier entorno V de (r, 0) siempre 
hay puntos (x, y) en U para los cuales hay dos puntos distintos (x, y, ±z) en U 
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(con lo que (x, y) debería tener dos imágenes) y puntos (a;, y) con x 2 + y 2 > r 2 
para los que no existe ningún z tal que (x, y, z) € U. Sin embargo, alrededor de 
este punto la esfera es la gráfica de la función x = y 'r 2 — y 2 — z 2 . 

El mismo argumento prueba en general que la esfera de dimensión n 

S n = {xe R n+1 | \\x\\l = 1} 

es una variedad diferenciable. 

Ejemplo: superficies de revolución Sea C una variedad diferenciable de 
dimensión 1 en IR 2 . Supongamos que todos sus puntos (x, z) cumplen x > 0. 
Llamaremos superficie de revolución generada por C al conjunto 

S={(x,y,z)ER 3 \ (^/x 2 + y 2 ,z) EC}. 

El conjunto S está formado por todos los puntos que resultan de girar al- 
rededor del eje Z los puntos de C. Vamos a ver que se trata de una variedad 
diferenciable de dimensión 2. 

Tomemos (xo,y 0 ,z 0 ) € S y xq = \J x\ + y 2 . Entonces (xo,zq) € C. Sea 
a(u) = (r(u),z(u)) una carta de C alrededor de este punto, digamos r(u 0 ) = ^o, 
z(uq) = z 0 . Por definición existe un entorno Vq de uq y un entorno Uo de (a?o, ¿o) 
de modo que C n U 0 = a[V 0 ]. Sea 

X(u, v) = (r(u) eos v, r(u) sen v, z(u)), (u, v) € Vq x IR. 

Claramente X es diferenciable (de la misma clase que a) y su matriz jaco- 
biana es 

TW x / r'(u)cosv r'(u) senv z'(u) \ 

JX(u,V) = / / / / n • 

y —r(u) senv r(u) eos v 0 J 

El menor formado por las dos primeras columnas es r(u)r'(u). Por hipótesis 
r no se anula y, por ser a una carta, su matriz jacobiana (/, z') no puede ser 
nula tampoco, luego si r'(u) = 0, entonces z'(u) ^ 0, luego uno de los menores 
r(u)z'(u) senv o —r(u)z'(u) cosv es no nulo. En cualquier caso el rango de JX 
es 2. 

Es claro que existe un ti 0 £ t tal que X(uq, v 0 ) = (xo,y 0 , zq). La aplicación 
X no es inyectiva, pero sí lo es su restricción a V = Vq x ]vq — ir, vo + ir[. Veamos 
que es una carta para el punto dado. Sea 

U = {(x eos v,x senv, z) \ (x,z) G Uo, \v — v 0 \ < ir}. 

Sin la restricción sobre v, el conjunto U sería la antiimagen de Uo por la 
aplicación continua (x, y, z) ^ (^/ ' x 2 + y 2 , z). En realidad U es la intersección 
de este abierto con el complementario del semiplano formado por los puntos 
(x eos «o, x sen vo, z), con x > 0, que es un cerrado, luego U es abierto. Es fácil 
ver que X[V] = U <1 S. Falta probar que X^ 1 es continua, ahora bien, dado 
(x, y, z) e UClS podemos obtener su coordenada u como u = a~ 1 (^x 2 + y 2 , z), 
que es una aplicación continua, y su coordenada v se obtiene aplicando a 
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(x/r(u),y/r(uj) la inversa del homeomorfismo v i— » (cosu,senii) definido para 
\v — Vq\ < 7r. Por lo tanto X\v es una carta alrededor de {xq, yo, z 0 ). 

Si la variedad C es cubrible por una única carta (r(it), z(tí)) , lo que se traduce 
en que C es una curva regular, entonces tenemos una única función X, de modo 
que todo punto de S admite como carta a una restricción de X. Expresaremos 
esto diciendo simplemente que X es una carta de S. 

Las líneas de la forma X(u,v 0 ) y X(uq,v), donde u 0 y v 0 son constantes, 
se llaman meridianos y paralelos de la superficie S. Los paralelos son siempre 
circunferencias paralelas entre sí, los meridianos son giros de la curva C. 

Los ejemplos más simples de superficies de revolución se obtienen al girar 
una recta. Si ésta es paralela al eje de giro obtenemos un cilindro, y en caso 
contrario un cono. En el caso del cono hemos de considerar en realidad una 
semirrecta abierta (r(u),z(u)) — (mu, u), para u > 0, pues para u — 0 tenemos 
el vértice del cono, donde S no es diferenciable. Una carta del cilindro es 

X(u,v) — (r eos v, rsen v, u), 

y para el cono tenemos 

X(u,v) — (mu eos v, mu sen v,u). 




Las figuras muestran algunos de los meridianos y paralelos del cilindro y el 
cono. Los meridianos son rectas y los paralelos circunferencias. 

Un caso mas sofisticado aparece al girar una circunferencia de radio r cuyo 
centro esté a una distancia R del eje Z, es decir, tomando 

(r(u), z(u)j = (R + rcosu, r sen u), con 0 < r < R. 

Todo punto de la circunferencia admite como carta a una restricción de 
esta curva. Así obtenemos un tubo de sección circular cerrado sobre sí mismo. 
Recibe el nombre de toro. 2 En este caso 

X(u,v) = (Rcosv + r eos u eos v, R senv + rcosi¿seni>,rsent¿). 

2 Del latín torus, que es el nombre dado en arquitectura a los salientes tubulares de las 
columnas. Obviamente no tiene nada que ver con taurus, el animal del mismo nombre en 
castellano. 
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Obviamente X es de clase C°°. Su restricción a ]0, 2ir[ x ]0, 2ir[ es inyectiva 
y cubre todos los puntos del toro excepto los de las circunferencias u = 0 y 
v = 0. Si llamamos U al complementario de la unión de estas dos circunferencias 
tenemos un abierto en IR 3 , y es claro que con él se cumple la definición de 
variedad. Igualmente se prueba que la restricción a n[ x ]—ir, n[ constituye 
una carta para los puntos exceptuados. Así pues, el toro es una superficie 
diferenciable de clase C°°. Sus meridianos son circunferencias de radio r. 

La esfera menos dos puntos antípodas puede considerarse como la super- 
ficie de revolución generada por la semicircunferencia (r sen (j>, r eos cf>) , para 
4> £ ]0, 7r[. La carta correspondiente es 

X(4>, 9) — (r sen 4> eos 9, r sen (j> sen 9, reos </)), <fi € ]0, 7r[ , 6 € ]0, 2n[ . 

Si p = X(cf>, 9) entonces 9 es la longitud de p en el sentido geográfico y (f> 
es la "colatitud", es decir, el ángulo respecto al polo norte. Los meridianos y 
paralelos coinciden con los geográficos. La carta no cubre los polos, aunque 
girando la esfera obtenemos otra carta similar que los cubra. ■ 

Ejemplo: Producto de variedades Si Si C M mi y S 2 C ffi m2 son variedades 
entonces Si x S 2 C M mi+m2 es también una variedad. Si X t : Ui — > Vi H Si 
es una carta alrededor de un punto pi € Si y X 2 : Ui — ► V2 n S2 es una carta 
alrededor de p 2 € ¿? 2 , entonces Ii x I 2 : í/i x C/ 2 — ► (^1 x V2) n (5i x S , 2 ) dada 
por (Xi x X 2 )(ui,u 2 ) = (Xi(ui), X 2 (u 2 )) es una carta alrededor de (pi,p 2 ). 

Sean 7r¿ : Sj x ^ — ► 5, las proyecciones. Si la carta JCj tiene coordenadas 
Xi, . . . , x ni y la carta X 2 tiene coordenadas y l7 . . . , y„ 2 , entonces las coordenadas 
de Xi x X 2 son las funciones ni oj¡ y 7r 2 oy¿, a las que podemos seguir llamando 
x¿ e y¿ sin riesgo de confusión. ■ 



5.2 Espacios tangentes, diferenciales 

Al principio de la sección anterior anticipábamos que los sistemas de coor- 
denadas en una variedad son un análogo a los sistemas de coordenadas en un 
espacio afín. La diferencia principal es que en el caso afín las coordenadas están 
definidas sobre todo el espacio, mientras que en una variedad las tenemos defi- 
nidas sólo en un entorno de cada punto. En esta sección desarrollaremos esta 
analogía mostrando que toda variedad diferenciable se confunde en un entorno 
de cada punto con una variedad afín. Para empezar, si p es un punto de una 
variedad S, X es una carta alrededor de p y x es su sistema de coordenadas 
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asociado, sabemos que en un entorno de x(p) el punto X(x) se confunde con 
p + dX(x(p)}(x — x(p)), con lo que los puntos de S se confunden con los de 
p + dX(x(p))[R n }. 

Definición 5.8 Sea S C R m una variedad diferenciable de dimensión n y sea 
X : U — > S una carta alrededor de un punto p € S. Sea x £ U tal que 
X(x) = p. Llamaremos espacio tangente a S en p a la variedad lineal T p (S) — 
dX(x)[R n ]. Llamaremos variedad tangente a S por p a la variedad afín p+T p (S). 

Puesto que JX(x) tiene rango n, es claro que las variedades tangentes tienen 
dimensión n. El teorema 5.5 prueba que el espacio tangente no depende de la 
carta con la que se construye, pues si X e Y son dos cartas alrededor de p, 
digamos X(x) = Y (y) = p, sabemos que g = X o Y^ 1 es diferenciable en un 
entorno de x y X = g o Y, luego dX(x) = dg(x) o dY(y), luego dX(x) y dY(y) 
tienen la misma imagen (pues dg(x) es un isomorfismo). El teorema siguiente 
muestra más explícitamente que T P (S) sólo depende de S. 

Teorema 5.9 Sea S C M" 1 una variedad diferenciable de dimensión n. En- 
tonces T p (S) está formado por el vector nulo más los vectores tangentes en p a 
todas las curvas regulares que pasan por p contenidas en S. 

Demostración: Sea X : U — > S una carta alrededor de p. Podemos supo- 
ner que es de la forma X(x) = (x, f(x)), para una cierta función diferenciable /. 
Sea X(pi) = p. Sea v G R n no nulo. Consideremos la curva x(t) = pi+tv. Para 
valores suficientemente pequeños de t se cumple que x(t) € U. Consideremos la 
curva a(t) = X(x(t)). Claramente a está contenida en 5 y cumple a(0) = p. 
Su vector tangente en p es 

a'(Q) = dX(x(Q))(x'(Q)) = dX( Pl )(v). 

Esto prueba que todo vector de T P (S) es de la forma indicada. Recíproca- 
mente, si a(t) es una curva regular contenida en S que pasa por p, digamos 
a(ío) = p, sea x(t) = X^ 1 (a(t)), definida en un entorno de ¿o- Se cumple 
que x(t) es derivable, pues X^ 1 no es más que la restricción de la proyección 
7r : M. m — > IR™, que es diferenciable, luego x = a o n. Tenemos a = x o X, luego 
a'(t) = dX(x(t))(x'(t)). Esta relación prueba que x'(t) ^ 0 o de lo contrario 
también se anularía a'(t). Por lo tanto x es regular. Además la tangente de a 
en p es a'(t 0 ) = dX(p 1 )(x'(t 0 )) G T p (S). m 

En la prueba de este teorema hemos visto un hecho importante: si a es 
una curva contenida en una variedad S y pasa por un punto p, dada una carta 
X : U — > S alrededor de p, podemos trasladar a la carta el arco de curva 
alrededor de p, es decir, existe otra curva x en U de modo que a = x o X (en 
un entorno de las coordenadas de p). En otras palabras, x es la representación 
de a en el mapa de 5* determinado por X. 

Ejercicio: Probar que el plano tangente a una gráfica vista como variedad diferen- 
ciable coincide con el que ya teníamos definido. 
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Precisemos la interpretación geométrica de la variedad tangente. Ya hemos 
justificado que los puntos de S se confunden con los de la variedad tangente 
T p (S) en un entorno de p, pero más exactamente, si X es una carta alrededor 
de p y x es su sistema de coordenadas, hemos visto que cada punto q e S 
suficientemente próximo a p se confunde con el punto 

p+dX(x(p))(x(q)-x(p))ep + T p (S). 

Definición 5.10 Sea S C R m , p € S, sea X : U — > V f\ S una carta alrededor 
de p y sea x su sistema de coordenadas. Llamaremos proyección asociada a X 
a la aplicación n p : S n V — > T p (S) dada por n p (q) = dX(x(p)) (x(q) — x(p)). 

Según hemos visto, la interpretación geométrica de estas proyecciones con- 
siste en que el paso q i— > ir p (q) es imperceptible si tomamos puntos q suficien- 
temente próximos a p. Ahora veamos que las coordenadas de q en la carta 
coinciden con las coordenadas de ir p (q) asociadas a un cierto sistema de refe- 
rencia afín en T p (S). 

Sea X : U — > S una carta de una variedad S. Sea X(x) = p. Entonces 
dX(x) : R™ — > 2p(¿>) es un isomorfismo. Por consiguiente, si e\, . . . , e n son los 
vectores de la base canónica en R n , sus imágenes dX(x)(ei) = DiX(x) forman 
una base de T p (S). El espacio tangente no tiene una base canónica pero, según 
acabamos de ver, cada carta alrededor de p determina una base en T p (S). Es 
claro que si q € S está en el entorno de p cubierto por la carta, las coordenadas 
de ir P (q) en la base asociada en T P (S) son x(q) — x(p), luego si con dicha base 
formamos un sistema de referencia afín en p + T p (S) cuyo origen sea el punto 
O = p — dX(x(p)) (x(p)), tenemos que las coordenadas de n p (q) en este sistema 
son precisamente x(q). Cuando hablemos del sistema de referencia afín asociado 
a la carta nos referiremos a éste. En conclusión, cada punto q de un entorno 
de p en S se confunde con el punto ir p (q) de idénticas coordenadas afines en la 
variedad tangente p + T p (S). 

Ejercicio: Probar que si Si y S2 son variedades diferenciables y (p, q) G Si x S2 
entonces T (p , q) (Si x S 2 ) = Xp(Si) x T q (S 2 ). 

Seguidamente generalizamos la noción de diferenciabilidad al caso de apli- 
caciones entre variedades cualesquiera (no necesariamente abiertos de IR"). 

Definición 5.11 Diremos que una aplicación continua / : S — > T entre dos 
variedades es díferenciable (de clase C q ) en un punto p € S si existen cartas 
X e Y alrededor de p y f(p) respectivamente de modo que X o f o Y^ 1 sea 
díferenciable (de clase C q ) en X^ 1 (p). 

El teorema 5.5 implica que la diferenciabilidad de / en p no depende de la 
elección de las cartas X e Y, en el sentido de que si unas cartas prueban que / 
es díferenciable, otras cualesquiera lo prueban igualmente. 

Es fácil ver que la composición de aplicaciones diferenciables es díferenciable. 
Una aplicación / : U — > W n definida en un abierto U de IR" es díferenciable 
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en el sentido que ya teníamos definido si y sólo si lo es considerando a U y a 
W n como variedades diferenciables (con la identidad como carta) . 

Por el teorema 5.4, si S C T C K TO son variedades diferenciables, la inclusión 
i : S — > T es diferenciable, lo que se traduce en que las restricciones a S de las 
funciones diferenciables en T son funciones diferenciables en S. 

Es claro que todas estas propiedades valen también si sustituimos la diferen- 
ciabilidad por la propiedad de ser de clase C q . 

Una aplicación / : S — > T entre dos variedades es un difeomorfismo si 
es biyectiva, diferenciable y su inversa es diferenciable. Dos variedades son 
difeomorfas si existe un difeomorfismo entre ellas. 

Es obvio que las cartas de una variedad son difeomorfismos en su imagen. 
Más aún: 

Teorema 5.12 Todo difeomorfismo entre un abierto de R n y un abierto de una 
variedad S en W n es una carta para S. 

DEMOSTRACIÓN: Sea / : U — > W un difeomorfismo, donde W C S es 
abierto en S. Entonces existe un abierto V en R m tal que f[U] = W = V H S. 
Obviamente df tiene rango máximo en cada punto, con lo que se cumple la 
definición de carta. ■ 

En particular tenemos que las coordenadas a;¿ : S ílV — > R asociadas a 
una carta X son funciones diferenciables (son la composición de X^ 1 con las 
proyecciones 7r¿ : IR™ — > K). Ahora definimos la diferencial de una función 
diferenciable. 

Supongamos que / : S — ► T es una aplicación entre dos variedades diferen- 
ciable en un punto p. Sean X : U — > S e Y : W — > T cartas alrededor de 
V Y f(p)- Digamos que U(x) = p, Y (y) = f(p). Entonces j = X o / o Y~ x es 
diferenciable en x y tenemos las aplicaciones lineales siguientes: 

T P (S) T f{p) (T) 

dX(x)\ ]dY(y) 
m dj(x) m 



Las flechas verticales representan isomorfismos, luego podemos definir la 
diferencial de / en p como la aplicación lineal df(p) : T p (S) — > Tf^(T) dada 
por d/(p) = dX(x)^ 1 o dj(x) o dY(y). Teniendo en cuenta que las diferenciales 
aproximan localmente a las funciones correspondientes no es difícil convencerse 
de que df(p) se confunde con / cuando los puntos de T p (S) se confunden con 
los de S. El teorema siguiente prueba que df(p) no depende de la elección de 
las cartas X eY. 

Teorema 5.13 Sea f : S — > T una aplicación diferenciable en un punto p G S. 
Sea v G T p (S). Si a es cualquier curva contenida en S que pase por p con 
tangente v, entonces a o f es una curva contenida en T que pasa por f(p) con 
tangente df(p)(v). 
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DEMOSTRACIÓN: Sean X e Y cartas alrededor de p y f(p) respectivamente. 
Digamos que X(x) = p e Y (y) = f(p). Sea [3 la representación de a en la 
carta X, es decir, a = (3 o X. Entonces v = a'(t n ) = dX (x) (0' (to)) ■ 

Podemos descomponer a o f = a o X^ 1 o X o f o Y^ 1 o Y. Con la notación 
que hemos empleado en la definición de df(p) tenemos ao f = ¡3 o j oY. Esto 
prueba que a o f es derivable en t 0 y ademas 

(a o /)'(*„) = dY(y)(dj(x)((3'(t 0 ))) = dY(y)(dj(x)(dX(x)-\v))) = df(p)(v). 

m 

Es inmediato comprobar que la regla de la cadena sigue siendo válida para 
aplicaciones diferenciables entre variedades, es decir, 

d(fog)(p)=df(p)odg(f(p)). 

De aquí se sigue en particular que si / es un difeomorfismo, entonces df(p) 
es un isomorfismo y df~ l if(pj\ = df(p)~ 1 . 

Si S C T C K m son variedades diferenciables entonces el teorema anterior 
prueba que la diferencial de la inclusión i : S — > T en cada punto p € S es 
simplemente la inclusión de T P (S) en T p (T). De aquí se sigue que la diferencial 
en un punto p de la restricción a 5 de una función / diferenciable en T es 
simplemente la restricción de df(p) a T p (S), pues la restricción no es más que 
la composición con la inclusión. 

Si X : U — > S es una carta de una variedad S alrededor de un punto 
p, entonces sus coordenadas asociadas Xi son ciertamente diferenciables. Más 
concretamente, si 7r¿ : W 1 — > R es la proyección en la i-ésima coordenada, 
tenemos que x¿ = X^ 1 o 7r¿, luego dxi(p) = dX(p)" 1 o dir^x) y en particular 

dx t (p) {Di X{x)) = dn, (x) ( ej ) = j ¿ ^ ~ í 

es decir, las aplicaciones dxi{p) forman la base dual de D\X(x), . . . , D n X(x). 
Por consiguiente, para cada v G T p (S) se cumple que dxi(p)(v) es la coordenada 
correspondiente a DiX(x) en la expresión de v como combinación lineal de las 
derivadas de X. 

Ejemplo Consideremos el plano tangente a IR 2 en el punto p = (1,1) (que 
es el propio R 2 ). La base asociada a la carta identidad es simplemente la base 
canónica (ei,e2), y su base dual es la dada por las proyecciones dx(p), dy{p). 
También podemos considerar también la carta determinada por las coordenadas 
polares (p, 9) , es decir, (x,y) = (p eos 6, p sen 9) . Su base asociada es la formada 
por las derivadas parciales: 



V\(p,9) = (cos9,sen9), V2(p,0) = (— psen9, pcos9). 
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En particular, en el punto (1,1) queda 

V2 = (-1,1). 



Vi 



1 1 




Dado un vector u € IR 2 , sus coordenadas (en 
la base canónica) son (dx(p)(u) , dy(p)(u)) , mien- 
tras que (dp(p)(u),d8(p)(u)) son sus coordena- 
das en la base (vi, v 2 ). 

Conocemos la relación entre las diferenciales: 



dx = eos 9 dp — p sen 9 d8, dy — sen 9 dp + p eos 9 d6. 

Concretamente, en el punto (1, 1) se cumple 

y/2 y/2 
dx = — dp — dB, dy = — dp + dB. 



(5.1) 



Sea ahora S la circunferencia de radio y/2. Tres posibles cartas de S alrededor 
de (1, 1) son 

gi (x) = (x,V¿-x 2 ), 92(y) = (y/2 -y 2 , y), g 3 (0) = y/2 (eos 6, sen 6). 

Sus funciones coordenadas son respectivamente (las 
restricciones de) las funciones x, y, 9, luego sus diferen- 
ciales asociadas son las restricciones de las diferencia- 
les correspondientes, que seguiremos llamando dx(p), 
dy(p), d9(p). Es fácil ver que las bases asociadas a las 
tres cartas son respectivamente 

v* = (l,-l), v v = (-l,l), v e = (-1,1). 

Obviamente no podemos tomar a p como coordenada, pues p es constante en S. 
Esto se traduce en que dp(p) = 0 (sobre T p (S)). Alternativamente, vemos que 
los vectores de T p (S) tienen nula la primera coordenada de su expresión en la 
base (^1,^2). Como consecuencia, de (5.1) se sigue ahora que dy = d9 = —dx. 




Ejemplo Consideremos el toro T de carta 

X(u, v) = (Rcosv + rcosucosv,Rsenv + r eos usen v, r sen u). 

Ya hemos comentado que X no es exactamente una carta de T, sino que 
las cartas de T son restricciones de X a dominios adecuados. Consideremos 
la circunferencia unidad 5 1 = {x £ M. 2 | = 1}. Entonces la aplicación 
/ : S* 1 x S 1 — > T dada por 

f(x, y) = (Ryi + rx 1 y 1 ,Ry 2 + rxiy 2 , rx 2 ) 
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es un difeomorfismo. Notemos que si x = (eos u, sen u), y = (eos v, sen v), enton- 
ces f(x,y) = X(u,v). Teniendo esto en cuenta es fácil ver que / es biyectiva. 
Además es diferenciable porque sus funciones coordenadas son polinómicas (es 
la restricción de una función diferenciable en IR 4 ). En un entorno de cada punto 
de T, la función / _1 puede expresarse como (eos u, sen u, eos v, sen v), donde u, 
v son las funciones coordenadas de la carta de T alrededor de punto obtenida 
por restricción de X. Por consiguiente / es un difeomorfismo. ■ 

Ejercicio: Probar que un cilindro es difeomorfo al producto de un segmento por una 
circunferencia y que una bola abierta menos su centro es difeomorfa al producto de 
un segmento por una esfera. 

Definición 5.14 Sea / : S — > IR una función definida sobre una variedad y 
sea p G S un punto donde / sea diferenciable. Sea X una carta de S alrededor 
de p y sean xi, . . . , x n sus coordenadas asociadas. Definimos la derivada parcial 
de / respecto a Xi en p como 

^{p) = df{p)(D i X{x)), 

donde x es el vector de coordenadas de p en la carta dada. 

Es claro que esta noción de derivada parcial generaliza a la que ya teníamos 
para el caso de funciones definidas en abiertos de IR". En el caso general sea 
j = X o f. Según la definición de df(p) resulta que 

Qf Qj 
g Xi (p)=dm(e i ) = —(x), 

donde e¿ es el ¿-ésimo vector de la base canónica de IR™. Si / es diferenciable en 
un entorno de p tenemos 

OXi OXi 

Ahora es claro que una función / es de clase C q en 5 si y sólo si tiene 
derivadas parciales continuas de orden q. 

Puesto que dxi(p), . . . , dx n (p) es la base dual de DiX(x), . . . , D n X(x), de 
la propia definición de derivada parcial se sigue que 

df = ^—dx x H h ^ — dx n . 

óxi dx x 

También es fácil ver que las reglas usuales de derivación de sumas y productos 
siguen siendo válidas, así como el teorema de Schwarz. Además 



dxj ( 1 si i = j 
dx, ~ 1 0 si i t¿ j. 



Es importante observar que la derivada de una función / respecto a una 
coordenada Xi no depende sólo de / y x¿, sino de la carta de la cual forma 
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parte x¿. Por ejemplo, si en la esfera de centro 0 y radio 1 consideramos un 
punto cuyas tres coordenadas (x, y, z) sean no nulas, en un entorno podemos 
considerar la carta de coordenadas (x,y), respecto a la cual 

dz x 

dx ~ y/1 - x 2 _ yl ' 

Sin embargo, también podemos considerar la carta de coordenadas (x, z) y en- 
tonces resulta que 

dz 
dx 

5.3 La métrica de una variedad 

Todas las propiedades métricas de IR™ se derivan de su producto escalar, que 
es una forma bilineal IR™ x IR™ — > IR. En una variedad S C IR m no tenemos 
definido un producto escalar, pero sí tenemos uno en cada uno de sus espacios 
tangentes: la restricción del producto escalar en IR m . 

Conviene introducir ciertos hechos básicos sobre formas bilineales. Puesto 
que son puramente algebraicas las enunciaremos para un espacio vectorial arbi- 
trario E, pero en la práctica E será siempre el espacio tangente T p (S) de una 
variedad S en un punto p. Fijada una base (v\, . . . ,v n ) de E, representare- 
mos su base dual por (dxi, . . . , dx n ). Esta notación — puramente formal en un 
principio — se ajusta al único ejemplo que nos interesa, pues si E = T p (S) y 
(vi, . . . ,v n ) es la base asociada a una carta X, entonces la base dual que en 
general hemos llamado (dx\, . . . , dx n ) es concretamente la formada por las dife- 
renciales dxi(p), . . . , dx n (p), donde x\, . . . ,x n son las funciones en S que a cada 
punto le asignan sus coordenadas respecto a X. 

Definición 5.15 Sea E un espacio vectorial de dimensión n. Llamaremos B (E) 
al conjunto de todas las formas bilineales F : E x E — > IR, que es claramente 
un espacio vectorial con la suma y el producto definidos puntualmente. 3 

Si /, g : E — > IR son aplicaciones lineales, definimos su producto tensorial 
como la forma bilineal / (X) g € B(E) dada por (/ ® g)(u, v) — f(u)g(v). 

Las propiedades siguientes son inmediatas: 

a) / O (g + h) = f <x> g + f ® h, (f + g)®h = f®h + g®h. 

b) (af) ® g = f <g> (ag) — a(f ® g), para a € IR. 

Teorema 5.16 Todo elemento de B(E) se expresa de forma única como 

n 

F = ciij dxi (8) dxj, con ctij £ IR. 
Concretamente a¿j = F(yi,Vj). 

3 Los elementos de B(E) se llaman tensores dos veces covariantes, pero aquí no vamos a 
entrar en el cálculo tensorial. 
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Demostración: Basta observar que 



(dxi ® dxj)(v r , v s ) = \ \ Slt r ' J 
1 0 en caso ce 



s 

0 en caso contrario. 



De aquí se sigue que F y el miembro derecho de la igualdad actúan igual sobre 
todos los pares de vectores básicos. La unicidad es clara. ■ 

Por ejemplo, en estos términos el producto escalar en R n viene dado por 

dx\ ® dx\ + • • • + dx n ® dx n . 

Definición 5.17 Un campo tensorial (dos veces covariante) en una variedad 
S C R m es una aplicación que a cada p <E S le hace corresponder una forma 
bilineal en T p (S). El tensor métrico de S es el campo g que a cada punto p le 
asigna la restricción a T p (S) del producto escalar en M m . 

Si llamamos T(S) al conjunto de los campos tensoriales en S según la defi- 
nición anterior, es claro que se trata de un espacio vectorial con las operaciones 
definidas puntualmente. Más aún, podemos definir el producto de una función 
/ : S — > R por un campo F g T(S) como el campo fF € T(S) dado por 
(fF)(p) = f(p)F(p). 

Sea X : U — > S 1 una carta de 5. Representaremos por xi,...,x„ las 
funciones coordenadas respecto a X. Si x € [/ y p = X(a;), sabemos que 
DiJ s í(a;), . . . , D n X(x) es una base de T P (S) y dxi{p), . . . , dx n (p) es su base dual. 
Por consiguiente, todo w € T p (S) se expresa como 

iü - dx 1 (p)(w)D 1 X(x(p)) + ■■■ + dx n (p)(w)D n X(x(p)). 

Así pues, si wi, W2 € T P (S), su producto escalar es 

n 

g p (w 1 ,w 2 )= ^ A^(a;(p))-Dj^(a;(p))rfa;¿(í')(wi)da; J (p)(w2), 

luego 

n 

9p= 9ij(p)dx l (p) ® darj-(p), con g ¿j (p) = AA(x(p))L' : ,X(x(p)), 

¿,.7 = 1 

o, más brevemente, como igualdad de campos: 

n 

g = ^2 gtjdx^dxj, (5.2) 

Esta expresión recibe el nombre de expresión en coordenadas del tensor 
métrico de S en la carta X. Las funciones se llaman coeficientes del tensor 
métrico en la carta dada. Claramente son funciones diferenciables. Notemos 
que la expresión coordenada no está definida en toda la variedad S, sino sólo 
sobre los puntos del rango V de la carta X. 
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La matriz {g%j{p)) es la matriz del producto escalar de T, p (S) en una cierta 
base. Es claro entonces que su determinante es no nulo. Este hecho será rele- 
vante en varias ocasiones. 

A través del difeomorfismo X : U — > V juntamente con los isomorfismos 
dX(x) : W l — > T p (S) podemos transportar la restricción a V del tensor métrico 
de S hasta un campo tensorial en U, concretamente el dado por 

h x (w 1 ,w 2 ) = g p (dX(x)(w 1 ), dX(x)(w 2 )) 

n 

= Y, g l] {X{x))dx l {X{x)){dX{x){w 1 ))dx 0 {X{x)){dX{x){w 2 )) 

*jj = l 

n 

= 9ij( x (x)) d(X o x i )(x)(w 1 ) d(X o Xj)(x)(w 2 ) 

n 

= 9ij( x ) dx t (x)(wi) dxj(x)(w 2 ), 

donde en el último término Xi es simplemente la proyección en la i-ésima coor- 
denada de U y gij(x) = (X o gij)(x). Por lo tanto hx tiene la misma expresión 
(5.2) interpretando convenientemente las funciones. 

Al transportar a la carta el tensor métrico, podemos calcular el producto 
de dos vectores tangentes a dos curvas a y (i que se cortan en p a partir de 
sus representaciones en X. Digamos que a(t) = X(x(i)) y (3{t) — X(x(ij) y 
supongamos que en t 0 pasan por p. Entonces 

g p (a'(t 0 ),p'(t 0 )) = h x (x'(t 0 ),x'(to)). 

Del mismo modo que el tensor métrico de una variedad S asigna a cada 
punto p el producto escalar de T p (S), también podemos considerar la aplicación 
que a cada punto p le asigna la norma en T p (S). Esta recibe el nombre de 
elemento de longitud de S y se representa por ds. Así pues, 

ds(p)(v) = \\v\\ = ^Jg P (v,v). 

El tensor métrico y el elemento de longitud se determinan mutuamente por 
la relación 

ds 2 (p)(u + v) = ds 2 (p)(u) + ds 2 (p)(v) + 2g p (u, v), 

luego en la práctica es equivalente trabajar con uno o con otro y ds suele dar 
lugar a expresiones más simples. Por ejemplo, la expresión de ds 2 en una carta 
es 

n 

ds 2 = gijduiduj. (5.3) 
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La misma expresión es válida para el campo que resulta de transportarlo al 
dominio de la carta interpretando adecuadamente las funciones. 

El nombre de elemento de longitud se debe a que si a : [a, b] — > S es 
una curva regular cuya imagen está contenida en el rango de una carta X y 
a(í) = X(x(t)), entonces ds 2 (x'(t)) = \\a'(t)\\ 2 , luego la longitud de a es 



/V(í)n 

J a 



dt = 



, ^g^x^x'^x'^dt 
a \ ij=i 



/ * Y.9iÁ<t))x' i {t)dtx' j {t)dt= / ds, 

Ja \ i Ja 



entendiendo ahora que en (5.3) x = x(t) y dxi — x'(t)dt. 

En el caso de una superficie S C M 3 es costumbre representar las derivadas 
parciales de una carta X(u, v) mediante X u , X v y los coeficientes del tensor 
métrico como E = X U X U , F = X U X V , G = X V X V , de modo que la expresión 
en coordenadas del tensor métrico es 



Edu<S> du + F(du ® dv + dv ® du) + G dv <£> dv. 
El elemento de longitud es 

ds 2 = Edu 2 + 2F dudv + Gdv 2 . 



(5.4) 



Ejemplo Vamos a calcular los coeficientes del tensor métrico de la superficie 
de revolución dada por 

X = (r(u) eos v, r(u) sen v, z{uj) . 

Tenemos 

X u = (r' (u) cosv,r' (u) sen v,z'(u)) 
X v = (— r(u)seni;, r(u) eos w, 0) , 

luego 

E = r'(u) 2 + z'(u) 2 , F = 0, G = r(u) 2 . 

Observemos que E es el módulo al cuadrado de la curva que genera la su- 
perficie, luego si su parametrización es la natural tenemos simplemente E = 1. 

En el caso del toro tenemos (r(u), z(u)) — (R + r eos u, r sen u), luego 

E = r 2 , F = 0, G = (R + rcosu) 2 . 

Por lo tanto la longitud de una curva que sobre la carta venga dada por 
(u(t),v(t)} se calcula integrando 

ds 2 = r 2 du 2 + (R + rcosu) 2 dv 2 . 
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Por ejemplo, la longitud de un arco de paralelo (u 0 ,t), donde t € [0, k] es 

I ds = I (R + r cosu 0 ) dt = (R + r eos u 0 )k, 
Jo Jo 

como era de esperar, dado que el paralelo es un arco de circunferencia de radio 
R + rcosu 0 . m 

Ejercicio: Calcular los coeficientes del tensor métrico del cilindro, el cono y la esfera. 

Definición 5.18 Diremos que un difeomorfismo / : S — > T entre dos varie- 
dades es una isometría si para todo arco a contenido en S se cumple que a o / 
tiene la misma longitud. 4 

Explícitamente, si / es una isometría y a : [a, b] — > S es un arco y a(t 0 ) = p, 
entonces 

f\\a'{x)\\dx = f\\{a o /)'(*) || dx, 

Ja Ja 

y derivando resulta 

||a'(í 0 )|| = ||(ao/)'(í 0 )|| = \\df(p)(a'(t 0 ))\\. 

Ahora bien, todo vector no nulo de T P (S) es de la forma a'(to) para un cierto 
arco a, luego tenemos que df(p) : T p (S) — > Tf^(T) es una isometría para todo 
punto p. Igualmente se prueba el recíproco. 

Ejercicio: Probar que las isometrías de R n en R" en el sentido que acabamos de 
definir coinciden con las isometrías en el sentido del álgebra lineal. 

Si / es una isometría, X es una carta alrededor de p con X(x) = p y llamamos 
Y = X o /, es claro que Y es una carta alrededor de f(p). Además tenemos que 
D l Y{x) = dY(x){ei) = df{p)(dX(x){e i )) = df(p)(DiX(x)), de donde se sigue 
que los coeficientes del tensor métrico son iguales en ambas cartas, es decir, 

gij (x) = D i X(x)D j X(x) = D l Y{x)D J Y{x). 

Similarmente se concluye que si dos variedades tienen cartas con un mismo domi- 
nio y con los mismos coeficientes del tensor métrico entonces los fragmentos 
de superficie cubiertos por las cartas son superficies isométricas. 



Ejemplo Consideremos la carta del cilindro dada por 
X{u, v) = (reos -, r sen - ,u). 

El elemento de longitud del cilindro es, en esta carta, ds 2 = du 2 + dv 2 , 
que es exactamente la misma que la del plano con la identidad como carta. La 
aplicación X no es una isometría porque no es biyectiva, pero sí es una isometría 
local, en el sentido de que todo punto del plano tiene un entorno V de modo 
que la restricción de X es una isometría entre U y X[U]. Así pues, un cilindro 
es localmente isométrico a un p lano. ■ 

4 En el capítulo siguiente probaremos que toda curva de clase C 1 es rectificable. Conside- 
raremos que esta definición se aplica a curvas y aplicaciones de clase C 1 , con lo que siempre 
tendremos garantizado el carácter rectificable. 
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*Ejemplo Observemos que las distintas expresiones que hemos obtenido para 
la longitud de un arco en el plano hiperbólico son de la forma (5.4) para ciertas 
funciones E, F, G. El caso mas simple es el del semiplano de Poincaré, donde 
E = G = l/v 2 , F = 0. Sucede que los distintos modelos del plano hiperbólico 
se comportan como cartas de una superficie que no conocemos, pero de la que 
tenemos su elemento de longitud. Existe una teoría abstracta de variedades 
diferenciales que permite tratar como tales a espacios topológicos dotados de 
una "estructura diferenciable" , definida adecuadamente, sin necesidad de que 
estén sumergidos en R n . El plano hiperbólico es una variedad en este sentido 
abstracto. 

El plano elíptico casi puede considerarse como una superficie en M' 5 : la esfera 
de radio 1. En realidad una esfera no es un plano elíptico, pues hemos de identi- 
ficar los puntos antípodas. Sin embargo, un "fragmento" no demasiado grande 
de plano elíptico es isométrico a un fragmento de esfera. Por ello podemos con- 
siderar a las cartas de una esfera que no cubran más de una semiesfera como 
cartas del plano elíptico. Un tratamiento completamente riguroso requeriría el 
concepto abstracto de variedad diferenciable. ■ 



5.4 Geodésicas 

Imaginemos la superficie S de un planeta cuyos habitantes creen que es 
plano. Cuando éstos creen caminar en línea recta en realidad sus trayectorias 
son curvas, sin embargo su distinción entre rectas y curvas tiene un significado 
objetivo. Tratemos de explicitarlo. Sea N P (S) el espacio normal a S en p, es 
decir, el complemento ortogonal de T P (S). Consideremos una curva a contenida 
en S. Entonces a'(t) € T a ^(S). Podemos descomponer a"(t) = v t (t) + v n (t), 
donde v t (t) £ T a u\(S) y v n (t) € N a t t \(S). La descomposición es única. El 
vector v n contiene la parte de la aceleración que mantiene a los habitantes del 
planeta pegados a su superficie (la gravedad) y es "invisible" para ellos, pues 
si el planeta fuera realmente plano la gravedad no curvaría sus trayectorias. El 
vector vt contiene la variación de la velocidad que ellos detectan: determina si 
la trayectoria se curva a la izquierda o a la derecha. Ellos llaman rectas a las 
curvas que cumplen v t = 0. A continuación desarrollamos estas ideas en un 
contexto más general: 

Definición 5.19 Sea S C W n una variedad de dimensión n, sea a : I — > S una 
curva regular y V : I — > R m una función de clase C 1 tal que para todo t £ I 
se cumpla V(t) £ T a ^(S). En estas condiciones diremos que V es un campo de 
vectores sobre a. Llamaremos derivada covariante de V en cada punto t a la 
proyección ortogonal de V'(t) sobre T a ^(S). La representaremos por DV(t). 

En la situación que describíamos antes, el vector v t es la derivada covariante 
del campo dado por V(t) = a' (i). Para ilustrar el caso general podemos pensar 
en un habitante del planeta S que camina rumbo norte con su brazo derecho 
apuntando hacia el noreste. Si interpretamos el brazo como un campo de vec- 
tores sobre su trayectoria, desde el punto de vista del caminante éste apunta 
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siempre en la misma dirección, pues él camina "recto" , es decir, sin desviarse ni 
hacia el este ni hacia el oeste, y su brazo forma un ángulo fijo con su dirección 
de avance. En otras palabras, considera que el campo vectorial es constante y 
su derivada es nula. Esto es falso, pues en realidad su trayectoria no es recta, 
sino una circunferencia y su brazo sí cambia de dirección (el único caso en que 
la dirección no variaría sería si apuntara al este o al oeste, con lo que siem- 
pre marcaría la dirección perpendicular al plano de la circunferencia en que se 
mueve). La que en realidad es nula es la derivada covariante del campo, que 
los habitantes confunden con la derivada total al desconocer la curvatura de su 
planeta. 

En las condiciones de la definición anterior, sea X : U — > S una carta de S 
y expresemos la curva (localmente) como a(t) = X(x(í)). Entonces una base 
de T Q ( t )(5) en cada punto es 

D 1 X(x(t)),...,D n X(x(t)), 

luego podremos expresar 

V(t) = oi(í)DiX(a:(í)) + • • • + a n {t)D n X{x{t)), (5.5) 

para ciertas funciones a¿(í). Multiplicando la igualdad por D¿X(x(í)) se obtiene 
un sistema de ecuaciones lineales con coeficientes gij(x(t)). Como el determi- 
nante es no nulo, resolviendo el sistema concluimos que las funciones a¿(í) son 
derivables. Entonces 

n n 

V'(t) = J2 a'i^DiXixit)) + J2 a i(t) DijX(x(t)Wj(t)- ( 5 - 6 ) 

2—1 Í.j — 1 

El primer término es tangente a S, luego no se altera al tomar la proyección 
ortogonal. Para calcular la proyección del segundo conviene introducir un nuevo 
concepto: 

Definición 5.20 Sea X : U — > S una carta de una variedad S. Llamaremos 
símbolos de Christoffel de S en la carta X a las funciones T k - : U — > IR que 
cumplen 

n 

D ij X = J2^i j D k X + N ij , (5.7) 
k=l 

donde Nij(x) G N P (S) (con p = X(x)). Observemos que = L*¿. 

Las proyecciones de las segundas parciales DijX se obtienen eliminando la 
componente Nij, con lo que al calcular la proyección de (5.6) llegamos a que la 
derivada covariante de V viene dada por 



n n 

dv = J2( a 'k + E "K-'-',)i>^- 

k=l *iJ=l 



(5.8) 
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Un hecho muy importante es que los símbolos de Christoffel, y por consi- 
guiente la derivada covariante, dependen únicamente de los coeficientes gij de la 
primera forma fundamental de S. En efecto, multiplicando las ecuaciones (5.7) 
por D¡X obtenemos 

n 

D ij XD l X = Y J 9kiT k i y 
fc=i 

Una simple comprobación nos da que 

D t:j XDiX = ^(D igjl + D ó gu - 
luego en total resulta 

n l 

Y, ^ij = o ( D i9H + D m - Dig l3 ) . (5.9) 
k=i ¿ 

Fijando i, j y variando l obtenemos un sistema de n ecuaciones lineales con 
n incógnitas y coeficientes (gki), que nos permite despejar los símbolos r¿- en 
términos de los coeficientes g^ y sus derivadas, como queríamos probar. Ahora 
nos ocupamos con detalle del caso particular que describíamos al principio de 
la sección: 

Definición 5.21 Sea a(t) una curva contenida en una variedad S. Llamaremos 
aceleración geodésica 5 de a a la derivada covariante del campo vectorial a'. 

Supongamos que a está parametrizada por el arco. Entonces ||a'(s)|| = 1, 
luego derivando resulta a"(s)a'(s) = 0, y esta ortogonalidad se conserva al 
proyectar sobre T p (S), de modo que Da'(s) es perpendicular al vector tangente 
de a. Llamaremos curvatura geodésica de a a n g = \\Da'\\. Si n g ^ 0 definimos el 
vector normal geodésico de a como el vector k^Dq', de modo que Da' = K g n g . 

En el caso de que a no esté parametrizada por el arco el vector normal 
geodésico y la curvatura geodésica se definen a través de su parametrización 
natural. Explícitamente, si a(t) es una curva contenida en S y s(t) es su longitud 
de arco, usando la notación v = s'(t) = \\a'(t)\\, a = v'(t) para la velocidad y 
aceleración sobre la trayectoria y T = a'(s) para el vector tangente, tenemos 

a'(t) = va'(s), a"(t) = aT + v 2 a"{s). 

Al proyectar sobre el espacio tangente resulta 

Da'(t) = aT+v 2 n g n g . 

De este modo, la aceleración geodésica de a se descompone en una acele- 
ración tangencial, cuyo módulo a es la tasa de variación de la velocidad v, y una 

5 La geodesia (gr. = división de la tierra) estudia la forma de la Tierra, deducida a partir de 
mediciones realizadas desde su superficie. La geometría diferencial ha adoptado este adjetivo 
para referirse en general a los conceptos que puede medir un "habitante" de una variedad 
arbitraria sin salir de ella. 
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aceleración normal, cuyo módulo es v 2 K g . Un habitante del planeta S que "crea" 
vivir en T p (S) confundirá la aceleración geodésica, el vector normal geodésico y 
la curvatura geodésica de a con la aceleración, el vector normal y la curvatura 
de a. Por lo tanto llamará rectas a las curvas sin aceleración geodésica: 

Definición 5.22 Una curva a contenida en una variedad S es una geodésica 6 si 
cumple K g = 0, o equivalentemente, si Da' es proporcional a a' en cada punto. 
En tal caso el factor de proporcionalidad es simplemente a = s"(t), donde s es 
la longitud de arco, por lo que si a está parametrizada por el arco entonces a 
es una geodésica si y sólo si Da' = 0. 

Vamos a particularizar las ecuaciones que determinan la derivada covariante 
de un campo al caso de la aceleración geodésica de una curva. Si a(t) = X(x(t)), 
entonces 

n 

a'(t) = Y / D l X(x(t))x¡(t), 

i=l 

luego si en (5.5) hacemos V = a' tenemos a¿ = 4 luego la fórmula (5.8) se 
convierte en 



k—l hj— 1 



El vector 



( x k+ T ^ x ' iX 'i) k=1 

es la antiimagen por dX de Da' , es decir, la representación en el mapa de la 
aceleración geodésica de a. Lo llamaremos expresión en coordenadas de dicha 
aceleración geodésica. 

La condición necesaria y suficiente para que una curva parametrizada por el 
arco de coordenadas x(s) sea una geodésica es 

n 

4' + ^ L* 44 - 0, k = l,...,n. (5.10) 

¿>.7=1 

Si la parametrización es arbitraria sólo hemos de exigir que el vector formado 
por los miembros izquierdos sea proporcional a x' . 

Ejemplo Si una carta X(u,v) de una superficie Sel 3 cumple F = 0, las 
ecuaciones (5.9) se reducen a 

r i _ E u 2 _ E v j _ E v 
11 ~ 2E' 11 ~ 2G" 12 ~2£' 



12 ~ 2G" 22 ~ 2E' 22 ~2G' { j 



"Deberíamos decir "recta geodésica", es decir, el equivalente en S a una recta, pero es 
preferible contraer el término pues, al fin y al cabo, normalmente las geodésicas no son rectas. 
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Ejemplo En un plano (tomando como carta la identidad) todos los símbolos 
de Christoffel son nulos, por lo que las geodésicas parametrizadas por el arco 
son las curvas que cumplen (u",v") = (0,0), es decir, las rectas. ■ 



Ejemplo En la superficie de revolución generada por la curva (r(u),z(u)\, 
suponiendo a ésta parametrizada por el arco, los únicos símbolos de Christoffel 
no nulos son 

H 2 = ^M, T\ 2 = -r{uy{u). 
Por lo tanto las ecuaciones de las geodésicas parametrizadas por el arco son 

u" = v' 2 r{u)r'{u), v" = -2v! v' ^ . 

r(u) 

Es inmediato comprobar que los meridianos (i, v 0 ) cumplen estas ecuaciones, 
luego son geodésicas. Si se cumple r'(u) = 0, (por ejemplo en los extremos 
locales de r) entonces el paralelo (uq, i) también cumple las ecuaciones, luego es 
una geodésica. 

En el caso concreto de la esfera los meridianos son los arcos de circunferencia 
de radio máximo que unen los polos. Dada la simetría de la esfera, que permite 
tomar cualquier par de puntos antípodas como polos, podemos afirmar que 
todas las circunferencias máximas son geodésicas. Para una carta dada, el único 
paralelo (u 0 , í) que cumple r'(u 0 ) = 0 es el ecuador de la esfera, que también es 
una circunferencia máxima, luego ya sabíamos que es una geodésica. ■ 



*Ejemplo Las fórmulas que determinan los símbolos de Christoffel a partir de 
los coeficientes del tensor métrico hacen que tenga sentido calcularlos en el caso 
de los planos elíptico e hiperbólico, donde la definición de derivada covariante 
que hemos dado no es aplicable. El hecho de que las circunferencias máximas de 
una esfera sean geodésicas se traduce en que las rectas elípticas sean geodésicas 
del plano elíptico (pues éste es localmente isométrico a una esfera de radio 1). 
Veamos ahora que las rectas hiperbólicas son geodésicas del plano hiperbólico. 
Para ello trabajaremos con el semiplano de Poincaré, donde los símbolos de 
Christoffel son más sencillos. Teniendo en cuenta que E = G= l/v 2 yF = 0 
es fácil ver que los únicos símbolos no nulos son 

r 2 _ 1 pl _ _ ! p2 _ ■' 

1 11 — ) 1 12 — i 1 22 — 

V V V 

La aceleración covariante de una curva de coordenadas (u, v) tiene coorde- 
nadas 

„ «V „ u' 2 -v 12 

u" - 2 , v" + 

v v 

Para las rectas verticales (u,v) = (uo,t) la aceleración es (0, — 1/i), que 
efectivamente es proporcional a (u', v') = (0, 1), luego son geodésicas. Las rectas 
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proyectivas restantes son las semicircunferencias (u, v) = (u 0 + r cosí, r sení). 
Un simple cálculo nos da que la aceleración en este caso es 

/ eos 2 1 \ eos t 

r cosí, — r = (— r sení, r cosí), 

\ sení J sení 

proporcional a (u',v') : luego todas las rectas proyectivas son geodésicas. ■ 

5.5 Superficies 

Terminaremos el capítulo con algunos resultados específicos sobre superficies 
S C M 3 . Si X es una carta de una superficie S, entonces X u , X v son en cada 
punto (u, v) una base del plano tangente en X(u, v), luego el vector X u A X v es 
no nulo y perpendicular a dicho plano. Si llamamos a al ángulo formado por 
X u y X v en un punto dado, entonces 

\\X U f\X v \\ 2 = \\X U \\ 2 \\X V \\ 2 {1 -eos 2 a) = X U X U X V X V - (X U X V ) 2 = EG - F 2 . 
Así pues, \\X U A X v \ \ = \JEG — F 2 . 

Definición 5.23 La aplicación de Gauss asociada a una carta X : U — ► S de 
una superficie S es la aplicación n : U — ► R 3 dada por 

. . _ X u A X v _ X u A X v 
n[U ' V) \\X U AX V \\ ^EG-F* 

De este modo, n(u, v) es en cada punto un vector unitario perpendicular a S 
en X(u, v). Esto lo determina completamente salvo en su sentido. Si cambiamos 
de carta, el sentido de n puede cambiar. 

Si X y X son dos cartas que cubren una misma región conexa de una va- 
riedad, entonces n(u,v) — e(u,v)ñ(u,v), donde e(u, v) = ±1. Es claro que e es 
una función continua en un conexo, luego ha de ser constante. En definitiva, 
n(u, v) = ±ñ(u, v). Resulta, pues, que en un entorno de cada punto de S existen 
exactamente dos determinaciones opuestas del vector normal. A cualquiera de 
ellas la llamaremos también aplicación de Gauss de la superficie. 

Si llamamos G C S a la imagen de A, la aplicación n induce otra aplicación 
n : G — > S 2 , donde S 2 es la esfera de centro (0,0,0) y radio 1, que está 
unívocamente determinada en un entorno de cada punto excepto por su signo. 
Es importante notar que no siempre es posible extender esta aplicación n a toda 
la superficie S (sin perder la continuidad). 

De momento no vamos a entrar en detalles, pero la 
figura muestra un ejemplo de variedad sobre la cual no 
es posible definir un vector normal. Se la conoce como 
banda de Móbius. Es una cinta pegada por sus extre- 
mos tras haberla girado media vuelta. Si la aplicación 
de Gauss pudiera definirse sobre toda la banda M, al 
componerla con una curva a : IR — ► M que dé una 
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vuelta completa obtendríamos un vector normal sobre a que variaría de forma 
continua, pero es claro que al dar una vuelta completa el vector normal termina 
en sentido inverso a como empezó, cuando por continuidad debería tender al 
vector de partida. 

La aplicación de Gauss aporta información importante sobre las superficies 
y simplifica algunos de los conceptos que hemos estudiado para variedades ar- 
bitrarias. Por ejemplo, en la sección anterior hemos estudiado la componente 
tangencial (o geodésica) de la curvatura de una curva contenida en una varie- 
dad. Del mismo modo podemos definir la curvatura normal como el módulo de 
la componente normal de la segunda derivada. En el caso de las superficies en 
R podemos apoyarnos en la aplicación de Gauss. 

Definición 5.24 Sea S una superficie (al menos de clase C 2 ) y a una curva 
contenida en S parametrizada por el arco y que pase por un punto p. Fijada 
una determinación n del vector normal a S alrededor de p, llamaremos curvatura 
normal de a a n n = a"n. Definimos N n — n n n y N t = a" — N n . 

Notemos que el signo de n n depende de la determinación que elijamos de la 
aplicación de Gauss. Supongamos que sobre una carta la curva es 
Entonces 

a' = X u u' + X v v', a" = X uu u' 2 + X u u" + X uv u' v' + X uv u'v' + X vv v' 2 + X v v" , 
luego 

K n = a"n = (X uu n)u 12 + 2(X uv n)u'v l + (X vv n)v 12 . 

Llamamos 

e = X uu n, f = X uv n, g = X vv n, 

que son funciones de la carta X (salvo por el signo, que depende de la elección 
del sentido de n). Si la parametrización de la curva no es la natural y s(t) es la 
longitud de arco, usamos la regla de la cadena: 

du du ds dv dv ds 
dt ds dt 1 dt ds dt ' 

con la que la fórmula, llamando ahora u' , v' , s' a las derivadas respecto de t 
(hasta ahora eran las derivadas respecto de s), se convierte en 

_ eu' 2 + 2fu'v' + gv' 2 

Observemos que esta expresión no depende de la curva (u,v), sino sólo de 
su derivada (u' 7 v') (recordemos que s' = \\(u' ,v')\\). De aquí deducimos: 

Teorema 5.25 (Teorema de Meusnier) Si S es una superficie, todas las 
curvas contenidas en S que pasan por un punto p con un mismo vector tan- 
gente tienen la misma curvatura normal. Esta viene dada por 
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DEMOSTRACIÓN: Es claro que X es una carta alrededor de p y a es una 
curva contenida en S que pasa por p con vector tangente w, entonces la re- 
presentación de a en la carta X es o a, luego el vector tangente de esta 
representación — el que en la discusión previa al teorema llamábamos (u',v') — 
es (du(p)(w), dv(p)(w)), donde ahora u y v son las funciones coordenadas de X. 

Así pues, la fórmula que habíamos obtenido nos da que 

= e(p) du(p) 2 (w) + 2f(p) du(p)(w)dv(p)(w) + g(p) dv(p) 2 (w) 
K n {P){w) E (p)du(p) 2 (w) + 2F(p)du{p){w)dv{p){w) + Gdv(p) 2 (w) ' 

entendiendo aquí a e, /, g como las composiciones con X^ 1 de las funciones del 
mismo nombre que teníamos definidas. ■ 

Definición 5.26 El elemento de longitud de una superficie S se conoce también 
con el nombre que le dio Gauss: la primera forma fundamental de S. Definimos 
la segunda forma fundamental de S como la aplicación que ap£ Sy cada vector 
w € T p (S) le asigna la curvatura normal en p de las curvas contenidas en S que 
pasan por p con tangente w multiplicada por ||w|| 2 . 

El teorema anterior prueba que la segunda forma fundamental es en cada 
punto puna forma cuadrática definida sobre T p (S). Concretamente, si fijamos 
una carta tenemos 

F 1 = E du 2 + 2F dudv + G dv 2 , F 2 = edu 2 + 2/ dudv + g dv 2 . 

Ambas formas cuadráticas pueden considerarse definidas tanto sobre la su- 
perficie S como sobre el dominio de la carta (en cuyo caso du y dv representan 
simplemente las proyecciones de IR 2 ). Sin embargo, una diferencia importante es 
que, aunque las expresiones anteriores son válidas únicamente sobre el rango de 
una carta, la primera forma fundamental está definida sobre toda la superficie 
y está completamente determinada por la misma, mientras que la segunda sólo 
la tenemos definida en un entorno de cada punto y además salvo signo. 

Para calcular explícitamente la segunda forma fundamental de una superficie 
notamos que 

_ y _ y X u A X v _ \X UU , X u , X v ) 
& J*-uun J*-uu~\ 



X u f\X v \\ JEG-F 2 



e igualmente 



r {X UVl X u ,X v *j i^X VVl X Ul X v ) 

sfEG^F 2 ' 9 ~ VEG^F 2 



Ejemplo Los coeficientes de la segunda forma fundamental de la superficie de 
revolución generada por la curva (r(w), z(u)) son 

z"{u)r'{u) - z'{u)r"{u) z'{u)r{u) 
y/r'(u) 2 + z'(u) 2 ' ' ,9 ~ ^fr'{u) 2 + z'(u) 2 ' 
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Para el caso del toro tenemos (r(u),z(u)) = (R+r eos v 7 r sen v) luego queda 
e = r, / = 0, g = Rcosu + r eos 2 u. 



Ejercicio: Comprobar que la curvatura normal en todo punto de la esfera de radio 
r y en toda dirección es igual a ±l/r, donde el signo es positivo si elegimos el vector 
normal que apunta hacia dentro de la esfera y negativo en caso contrario. 



5.6 La curvatura de Gauss 

Es un hecho conocido que si F es una forma bilineal simétrica en un espa- 
cio euclídeo existe una base ortonormal en la que la matriz de F es diagonal. 
Podemos aplicar esto a un plano tangente T p (S) de una superficie tomando el 
producto escalar determinado por la primera forma fundamental y como F la 
segunda forma fundamental. Entonces concluimos que existe una base (ei,e2) 
de T p (S) en la cual las expresión en coordenadas de las formas fundamentales 
es 

F\x,y) = x 2 + y 2 y F 2 (x, y) = X lX 2 + X 2 y 2 . 

Los números Ai y A2 son los valores propios de cualquiera de las matrices 
de F 2 en cualquier base ortonormal de T p (S), luego están unívocamente de- 
terminados salvo por el hecho de que un cambio de carta puede cambiar sus 
signos. Podemos suponer Ai < A 2 . Entonces se llaman respectivamente curva- 
tura mínima y curvatura máxima de S en p. En efecto, se trata del menor y el 
mayor valor que toma F 2 entre los vectores de norma 1, pues 

Ai = Ai(:r 2 + y 2 ) < \ x x 2 + X 2 y 2 = F 2 (x, y) < X 2 (x 2 + y 2 ) = A 2 . 

Si w € T p (S) tiene norma arbitraria entonces aplicamos esto a u>/IIH y 
concluimos que 

F 1 (w) 

es decir, Ai < n n < X 2 . Así pues, Ai y X 2 son la menor y la mayor curvatura 
normal que alcanzan las curvas que pasan por p. Además se alcanzan en direc- 
ciones perpendiculares C\ y e 2 , llamadas direcciones principales en p. Notemos 
que puede ocurrir Ai = X 2 , en cuyo caso la curvatura normal es la misma en 
todas direcciones y no hay direcciones principales distinguidas. Los puntos de 
S donde Ai = A 2 se llaman puntos umbilicales. 

Veamos ahora cómo calcular las direcciones principales en una carta. Consi- 
deremos la fórmula de Meusnier como función (diferenciable) de dos variables. 
Si (du, dv) marca una dirección principal 7 entonces n n es máximo o mínimo 



7 Aquí podemos considerar (du,dv) S K 2 . La notación diferencial está motivada por lo 
siguiente: Fijada una carta con coordenadas u, v, una curva regular en la superficie viene 
determinada por una representación coordenada (u(t),v(t)). El vector tangente a la curva en 
un punto dado marcará una dirección principal si y sólo si la fórmula de Meusnier evaluada 
en {u 1 (t) , v' (t)) toma un valor máximo o mínimo, pero dicha fórmula depende sólo de las 
diferenciales (du(t), dv(t)), por lo que en realidad buscamos una relación entre du y dv. 
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en este punto, luego el teorema 4.15 afirma que sus derivadas parciales han de 
anularse en él. Así pues, se ha de cumplir 



dn n 2(edu + fdv) 

ddu F 1 (du,dv) 
dn n 2(fdu + gdv) 

ddh 1 F 1 (du,dv) F 1 {du,dvf 



2{Edu + Fdv) 

F 1 (du, dv) 2 
2{Fdu + Gdv) 



F 2 (du,dv) = 0, 



F 2 (du,dv) = 0. 



Despejando obtenemos 



F 2 (du,dv) edu + fdv 



(5.12) 



F 1 (du,dv) Edu + Fdv' 
F 2 (du, dv) f du + g dv 
Kn = F 1 (du,dv) = Fdu + Gdv 

Al igualar ambas ecuaciones obtenemos una condición necesaria para que un 
vector indique una dirección principal. Es fácil ver que puede expresarse en la 
forma: 

dv 2 —dudv du 2 
E F G = 0. 

e / 9 

Si (E, F, G) (en un punto) es múltiplo de (e, /, g) entonces la ecuación se 
cumple trivialmente, pero por otra parte es claro que la curvatura normal es 
constante y no hay direcciones principales. En caso contrario es claro tenemos 
una forma cuadrática con al menos dos coeficientes no nulos. Si suponemos, 
por ejemplo, que el coeficiente de dv 2 es no nulo, entonces du ^ 0, y al dividir 
entre du 2 la forma cuadrática se convierte en una ecuación de segundo grado 
en la razón dv/du. Esta ecuación tiene a lo sumo dos soluciones linealmente 
independientes, luego éstas han de ser necesariamente las direcciones principales. 
Por consiguiente la ecuación caracteriza dichas direcciones. 

Definición 5.27 Se llama curvatura media y curvatura total o de Gauss de una 
superficie S en un punto p a los números 



H 



Ai + A 2 
2 : 



K = AiA 2 . 



Notemos que el signo de H depende de la carta, mientras que el de K es 
invariante. Si operamos en (5.12) obtenemos 

(e - En n )du + (/ - Fn n )dv = 0, 
(/ - Fn n )du +{g- Gn n )dv = 0. 

Puesto que el sistema tiene una solución no trivial en (du,dv) se ha de 
cumplir 

e - Ek„ f - Fn n = 
/ - Fk„ g - Gn n 
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o equivalentemente 



(EG-F 2 )n 2 n 



(eG - 2Ff + gE)K n + (eg - f 2 ) = 0. 



Esta ecuación la cumplen las curvaturas principales n n = Ai, A2 y por otro 
lado tiene sólo dos soluciones, luego 



En particular vemos que la curvatura de Gauss es el cociente de los deter- 
minantes de las dos formas fundamentales. 

Ejercicio: Calcular la curvatura media y la curvatura de Gauss del cilindro, el cono, 
el toro y la esfera. 

Definición 5.28 Un punto p de una superficie S es elíptico o hiperbólico según 
si K(p) > 0 o K(p) < 0. Si K(p) = 0 distinguiremos entre puntos parabólicos, 
cuando sólo una de las curvaturas extremas es nula y puntos planos, cuando las 
dos curvaturas extremas son nulas. 

Si un punto es elíptico todas las curvas que pasan por él tienen la curvatura 
normal del mismo signo, por lo que la superficie se curva toda hacia el mismo 
lado del plano tangente, como es el caso de la esfera o del toro. Si un punto es 
hiperbólico entonces hay curvas (perpendiculares, de hecho) que pasan por él 
con curvaturas en sentidos opuestos, luego la superficie tiene puntos próximos 
a ambos lados del plano tangente. Es el caso del hiperboloide z — x 2 — y 2 , cuya 
curvatura en la carta (u, v, u 2 — v 2 ) viene dada por K = — 4/a/4u 2 + 4t> 2 + 1 3 . 

Los puntos de un cilindro son parabólicos. Las curvas u =cte. y v =cte. 
son circunferencias de radio r y rectas, respectivamente. Las primeras tienen 
curvatura normal A2 = 1/r y las segundas Ai = 0. Es fácil ver que se trata de 
las curvaturas principales. Todos los cálculos son sencillos. 

Todos los puntos de un plano son puntos planos. Otro ejemplo es el punto 
(0, 0) en la gráfica de x 3 + y 3 . 



K 



H 



eG - 2Ff + gE 
2{EG-F 2 ) 

eg-f 2 



(5.13) 
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Probamos ahora una caracterización algebraica de la curvatura de Gauss que 
más adelante nos dará una interpretación geométrica de la misma. Observemos 
que si n es una determinación del vector normal alrededor de un punto p en 
una superficie S y llamamos S 2 a la esfera de centro (0,0,0) y radio 1, enton- 
ces dn(p) : T p (S) — > T„( p )(S' 2 ), pero como n(p) es perpendicular a T P (S), en 
realidad T n ^(S 2 ) = T p (S), luego podemos considerar a dn(p) como un endo- 
morfismo de T p (S). 

Teorema 5.29 Sea S una superficie y n una determinación del vector normal 
alrededor de un punto p. Entonces K(p) = \dn(p)\. 

Demostración: Sea X una carta alrededor de p. Entonces una base de 
T P (S) la forman los vectores X u y X v . Llamemos n(u, v) a X o n. Entonces 

dn(p)(X u ) = dn(p)(dX(u, v)(l, 0)) = dn(u, v)(l, 0) = n u , 
dn(p)(X v ) = dn(p)(dX(u,v)(Q,l)) = dn(u,v)(Q,l) = n v . 

Si expresamos 

n u = aX u + bX v 
n v = cX u + dX v 

entonces el determinante de dn(p) es el de la matriz formada por a, b, c, d. 
Notemos que derivando las igualdades nX u = nX v = 0 se deduce la relación 
n u X u = —nX uu = — e y similarmente n u X v — n v X u = —f, n v X v = —g. Por 
consiguiente al multiplicar las ecuaciones anteriores por X u y X v obtenemos 

-e = aE + bF, -f = aF + bG, -f = cE + dF, -g = cF + dG, 

de donde 

e / \ _ ( a b \ ( E F 
f g ) \c d )\F G 

Tomando determinantes concluimos que 

eg-f 2 = \dn(p)\(EG-F 2 ), 
luego efectivamente |dn(p)| = K{p). ■ 

Consideremos ahora las fórmulas (5.7) que definen los símbolos de Christof- 
fel. Al particularizarlas al caso de una superficie se convierten en 

X uu = T^Xu + T\ X X V + en, 

x uv = rj 2 ^"« + r^x^ + fn, 
X vv = r 22 x„ + r 2 2^"t, + gn, 



(en principio la componente normal ha de ser de la forma an para cierto a, y 
multiplicando la igualdad por n se sigue que a = e,f,g según el caso.) 
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De estas ecuaciones se sigue 

X uu X vv -X 2 uv = eg-f + (I^rk - {T\ 2 ) 2 )E 

+ ( r ii r 22 + r ii r 22 _ 2r i2 r i2)^ 

+ (r?^2 - (r? 2 ) 2 )G. 

Por otra parte, derivando respecto auyii respectivamente las relaciones 
X UU X V F u —E VJ X UV X V ~^G U 
y restando los resultados obtenemos 

X UU X VV X uv ~^E VV -\- F uv ~^G UU . 
En definitiva resulta la expresión 

e .9 — f 2 = —^e vv + f uv - -G uu - (r^r^ — {t\ 2 ) 2 )e 

~ (rliT^ + TiiT^ — 2t\ 2 t\ 2 }f 
- ( r n r 22 - (r 12 ) 2 )G. 

La fórmula (5.13) muestra ahora que la curvatura de Gauss de un punto 
depende únicamente de los coeficientes E, F, G de la primera forma fundamental 
y sus derivadas. Puesto que dos superficies localmente isométricas tienen cartas 
con los mismos coeficientes E, F, G, hemos probado el resultado que Gauss, en 
sus Diquisitiones generales circa superñcies curuas, presentó con el nombre de 
theorema egregium: 

Teorema 5.30 (Gauss) Las isometrías locales conservan la curvatura. 

Las ecuaciones (5.11) nos dan la siguiente expresión para la curvatura res- 
pecto a una carta con F = 0: 

jy- _ E U G U + E 2 E V G V + G 2 ^ _ E vv + G uu . _ 
4£ 2 G AEG 2 2EG ' 81 ~ 

Desde aquí es fácil deducir a su vez los siguientes casos particulares: 

+ **-<>. 
i d 2 VG 

K = ~7G^ »f = o.* = i. 

En particular, la curvatura de la superficie de revolución definida por la 
curva {r(u),z{uj) es 

r"{u) 



K= — 



r{u) 
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*Ejemplo Notemos que sin el teorema de Gauss no tendría sentido hablar 
de la curvatura del plano hiperbólico, pues lo único que sabemos de él es que 
sus modelos se comportan como cartas de una variedad desconocida de la que 
tenemos su primera forma fundamental. Sin embargo, las fórmulas anteriores 
nos permiten calcular su curvatura a partir de estos datos. Por ejemplo, en el 
caso del semiplano de Poincaré, donde E=G=í/v 2 yF — 0, ahora es fácil 
calcular que K = — 1. Así pues, si pudiéramos identificar el plano hiperbólico 
con una superficie en IR 3 , ésta tendría que tener curvatura constante igual a 
— 1. En el caso del plano elíptico sabemos que localmente es como la esfera de 
radio 1, luego si pudiéramos identificar el plano elíptico con una superficie de 
K 3 , ésta tendría que tener curvatura constante igual a 1. Ahora vamos a probar 
que existen variedades cuya relación con el plano hiperbólico es la misma que 
hay entre la esfera y el plano elíptico. ■ 

Ejemplo Se llama pseudoesfera a la superficie de revolución P generada por 
la tractriz. Recordemos que la tractriz es 



(r(ii),z(u)) = I l senu, l eos u + Zlog tan ■ 



Por lo tanto la pseudoesfera está dada por 



/ 

X(u,v) = ll sen u eos v, l sen it sen i>, / eos u + Hog tan ■ 

Recordemos también que la longitud de arco es s = 
— Hog sen u, luego senu = e~ s l l . La carta de P que 
resulta de tomar la tractriz parametrizada por el arco 
tiene la primera forma fundamental determinada por 



E = l, F = 0, G = r(s) 2 = l 2 e 



-2s/l 



De aquí se sigue fácilmente que K = —l/l 2 . 

Por lo tanto un ejemplo de superficie de curvatura 
constante igual a K < 0 es la pseudoesfera 



1 / u 
-= I sen u cosí;, sen usen v, eos u + logtan — 
—K V 2 




*Nota La pseudoesfera es al plano hiperbólico lo que un cilindro es al plano 
euclídeo. En efecto, hemos visto que si parametrizamos por el arco la tractriz 
obtenemos una carta de la pseudoesfera cuya primera forma fundamental es 
(para l — 1) 

ds 2 = dw 2 + e- 2u dv 2 , 

donde w £ ]0,+oo[ es la longitud de arco de la tractriz (que arriba repre- 
sentábamos por s). Las cartas de la pseudoesfera tienen dominios de la forma 
(uj, v) G ]0, +oo[x]vo — ti", vq + 7r[. Si ahora hacemos el cambio (u>, v) — (log y, x) 
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obtenemos cartas con dominios de la forma ]xq — ir, x 0 + n[ x ]1, +oo[ de modo 
que la primera forma fundamental pasa a ser 

2 dx 2 + dy 2 

ds = 2 ' 

y 2 

es decir, exactamente la del semiplano de Poincaré. Un cálculo rutinario nos da 
la forma explícita de estas cartas: 

/ eos x sen x \/y 2 — 1 1 . „ , 1 , i-^ 7 \ \ 

X(x,y)= í — ,— — ,~— y + ^og(y-í) + -log(y+^y 2 -l). j 

Esto significa que un fragmento del semiplano de Poincaré de la forma 
]xo — ir, x 0 + 7r[ x ]l,+oo[ puede verse como un mapa de la pseudoesfera de 
modo que la longitud hiperbólica en el mapa coincide con la longitud euclídea 
sobre la superficie. Por lo tanto la porción de pseudoesfera cubierta por la 
carta (toda ella menos un meridiano x =cte.) puede identificarse con un frag- 
mento de plano hiperbólico exactamente igual que una porción de esfera puede 
identificarse con un fragmento de plano elíptico. 

La situación es, como decíamos, análoga a la del cilindro dado por 

(r cos(v/r), r sen(v/r), uj , 

cuya primera forma fundamental es ds 2 = dx 2 + dy 2 , igual que la del plano. La 
diferencia es que, en este caso, al quitarle una recta x =cte. podemos desplegarlo 
hasta hacerlo plano sin modificar su primera forma fundamental, mientras que 
la pseudoesfera no puede desplegarse sin sufrir estiramientos que alteren su 
métrica y su curvatura. Por ello no podemos extenderla a un plano hiperbólico 
completo. ■ 



Capítulo VI 

Ecuaciones diferenciales 
ordinarias 

Una ecuación diferencial ordinaria es una relación de la forma 

f(t,y(t),y'(t),...,y n \t))=0, 

donde / : D C R n+2 — > leí/ : í — > R es una función definida en un 
intervalo / derivable n veces. Normalmente la función y es desconocida, y 
entonces se plantea el problema de integrar la ecuación, es decir, encontrar 
todas las funciones y que la satisfacen. El adjetivo "ordinaria" se usa para 
indicar que la función incógnita tiene una sola variable. Las ecuaciones que 
relacionan las derivadas parciales de una función de varias variables se llaman 
ecuaciones diferenciales en derivadas parciales, pero no vamos a ocuparnos de 
ellas. Dentro de las ecuaciones ordinarias, nos vamos a ocupar únicamente de un 
caso mas simple pero suficientemente general: aquel en que tenemos despejada 
la derivada de orden mayor, es decir, una ecuación de la forma 

y")(í) = /(í,y(í),y'(í),...,y"- 1 )(í)). 

El número n se llama orden de la ecuación. El caso más simple es la ecuación 
de primer orden y' = f(t). Sabemos que si la ecuación tiene solución de hecho 
hay infinitas de ellas pero, en un intervalo dado, cada una se diferencia de 
las demás en una constante, de modo que una solución queda completamente 
determinada cuando se especifica un valor y(to) = yo- Veremos que esto sigue 
siendo válido para todas las ecuaciones de primer orden. Por ello se define un 
problema de Cauchy como 

y' =f(t,y)\ 
y (ta) = yo J 

Resolver el problema significa encontrar una función y definida alrededor de 
t 0 de modo que satisfaga la ecuación diferencial y cumpla la condición inicial 
y(to) = yo- Probaremos que bajo condiciones muy generales los problemas de 
Cauchy tienen solución única. 
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Toda la teoría se aplica igualmente al caso de sistemas de ecuaciones diferen- 
ciales. De hecho un sistema de ecuaciones puede verse como una única ecuación 
vectorial. Basta considerar que y: I — >R"y/:flC R n+1 — > R n . 

Son muchas las ocasiones en las que el único conocimiento que tenemos de 
una o varias funciones es el hecho de que satisfacen un sistema de ecuaciones 
diferenciales. Por ejemplo, las ecuaciones (5.10) del capítulo anterior son un 
sistema de ecuaciones de segundo orden que determinan cuándo una curva x(s) 
representa a una geodésica de una variedad en una carta dada. Los resultados 
que probaremos en este capítulo nos asegurarán en particular la existencia de 
geodésicas. De momento no tenemos garantizada la existencia de solución ni en 
el caso más simple: y' — f(x). Este es el primer punto que hemos de estudiar, 
lo que nos lleva a profundizar un poco más en el cálculo integral. 



6.1 La integral de Riemann 

Recordemos que hemos definido la expresión 




como F(b) — F(a), donde F es una primitiva de /, pero la interpretación 
geométrica era el número que resulta de dividir el intervalo [a, b] en intervalos 
infinitesimales de longitud dx y sumar los incrementos infinitesimales f(x)dx. 
Vamos a dar rigor a esta idea, lo que nos llevará a una construcción de la integral 
que no postule la existencia de la primitiva. 

La técnica será, por supuesto, sustituir la división en infinitos intervalos in- 
finitesimales por particiones en intervalos de longitud arbitrariamente pequeña. 
Puede probarse que no importa cómo escojamos estas particiones, por lo que 
trabajaremos concretamente con intervalos de longitud 2~™. 

Para cada número natural n sea P n = {2~ n k \ k € Z}. Para cada x € P n 
sea x' n = x + 2~ n . De este modo, la recta real se divide en una unión disjunta 
de intervalos de longitud 2~ n 

R = |J [x,x' n [. 

Llamaremos 3 al conjunto de todas las funciones / : R — > R tales que el 
conjunto {iGR f(x) ^ 0} está acotado. Para cada / € 3 definimos 

Sn(f) = £ f{x)2~ n . 
x6P„ 

Notar que / se anula en todos los puntos de P n salvo a lo sumo en un 
número finito de ellos, luego la suma anterior es en realidad una suma finita. 
La suma S n (f) es la aproximación de la integral de / que resulta de aproximar 
el incremento infinitesimal dx por el incremento finito 2~™. 
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Diremos que / es integrable Riemann si existe 

ff(x)dx = límS n (f) el. 



A esta cantidad la llamaremos integral de Riemann de /. Llamaremos 3? al 
conjunto de todas las funciones de J que son integrables Riemann. 

Si A C R, llamaremos función característica de A a la función xa '■ R — > R 
dada por 

/ \ f i si i e A 



0 si x £ A 

Dado un intervalo [a, 6] y una función / : R — > R, es claro que fx[a,b] € 3^ 
Diremos que / es integrable Riemann en [a, b] si /X[o,6] es integrable Riemann. 
En tal caso llamaremos 



J f(x) dx = Jf(x)xA(x) dx. 



Es obvio que la integrabilidad de / en [a, b] y, en su caso, el valor de la 
integral sólo dependen de la restricción de / al intervalo considerado. Por lo 
tanto, si / es una función definida en [a, b], diremos que es integrable Riemann 
en [a, b] si lo es la extensión a R que toma el valor 0 en todos los puntos exteriores 
a [a, b]. Así, una función es integrable en [a, b] si y sólo si lo es, en este sentido, 
su restricción a dicho intervalo. 

Llamaremos 3l(a, b) al conjunto de todas las funciones integrables Riemann 
en [a, b}. 

Observemos que si / € 31, entonces existe un intervalo [a, b] tal que / se 
anula fuera de [a, b], con lo que / = fx[a.b] y P° r lo tanto / € 3£(a, b) y 



Jf(x) dx = J f(x) dx. 



Por consiguiente no perdemos generalidad si trabajamos con funciones inte- 
grables en un intervalo fijo. 

Teorema 6.1 Sea [a,b] un intervalo. Se cumplen las propiedades siguientes: 

a) Si f, g e 3£(a, b) y a, (3 € R entonces af + fig € 3£(a, b) y 

i'b rb í-b 

I (af(x) + (3g(x)) dx = a / f(x) dx + (3 f(x) dx. 

Ja Ja Ja 

b) Si f, g G Di(o, b) y f < g entonces 

\ f(x)dx< l g(x)dx. 

Ja Ja 
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c) Si f € 3?(a, fe) y |/| también es integrable entonces 

í f(x)dx < í \f(x)\dx. 

Ja Ja 

d) Si k € [a, fe] entonces \{k} € 3?(a, fe) y 

/ X{fc} = 0. 

J a 

e) Si a < c < b, / € 3?(a, c) y / € 3?(c, fe) entonces / G 3?(a, fe) ?/ 

/>c />6 

/ /(x) dx = f(x) dx+ f(x) dx. 

Ja Ja Je 

f) La función constante igual al es integrable en [a, fe] y 



s 

Ja 



dx = fe — a. 



DEMOSTRACIÓN: Las tres primeras propiedades son obvias para las sumas 
S n y se trasladan a las integrales por las propiedades de los límites. Para 
probar d) observamos que si k G P n para algún no entonces S n (\{k}) = 2~", 
para n > n 0 y en caso contrario S n (x{k}) = 0 para todo n. En cualquier caso 
el límite cuanto n tiende a infinito vale 0. 

Para probar e) observamos que 

fX[a,b] = fX[a,c] + fX[c,b] - f( c )X{c}- 

El resultado es inmediato a partir de los apartados anteriores. Para demos- 
trar f ) consideramos la suma 

Sn(X[a,b]) = X[a,b]( X ) 2 ~ n 

x£P n 

Si los puntos de P n contenidos en [a, fe] son a < xq < ■ ■ ■ < Xk < fe, es claro 
que k2~ n = x k - x 0 < fe - a y (fe - a) - ¥T n =x 0 -a + b-x k < 2"" +1 . Por 
lo tanto 

\S n ( X [a M ) -(b-a)\ = \(k + 1)2-" - (fe - a)\ < 2~ n+í + 2"", 
luego existe 

KmS n {x[ a ,b}) = b-a. 



El teorema anterior puede mejorarse considerablemente. Por ejemplo, puede 
probarse que si / es integrable entonces |/| también lo es, con lo que sobra la 
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hipótesis correspondiente en el apartado c) . Así mismo, si a < c < b, la integra- 
bilidad de / en [a, b] implica la integrabilidad en [a,c] y [c,b]. También puede 
probarse que el producto de funciones integrables es integrable. No entraremos 
en todo esto porque vamos a trabajar únicamente con funciones continuas, y 
estos hechos resultan triviales en este caso una vez probado el teorema siguiente. 

Teorema 6.2 Toda función continua en un intervalo [a, b] es integrable Rie- 
mann en [a, b] . 

Demostración: En la prueba usaremos la siguiente observación sobre las 
sumas S n (f): Si una función / es constante sobre cada intervalo [a;, a4[ con 
x e P n , entonces S n (f) = S n+1 (f). 

En efecto, los puntos de P n +i son los de P n y los de la forma x + 2~"~ 1 , con 
x € P n . Por consiguiente 

S n +i(f)= ^(/(x) + /(x + 2-"- 1 ))2-"- 1 = Y, 2/(z)2- n - 1 = S n (f). 

I6P„ l£P„ 

De aquí se sigue a su vez que S n (f) — S m (f) para m > n. 

Consideremos ahora una función / continua en [a, b] y sea e > 0. Por el 
teorema 2.36 sabemos que / es uniformemente continua en [o, b], luego existe 
un S > 0 tal que si x, x' € [a, b] cumplen \x — x'\ < 5 entonces 

\f(x)-f(x')\< 



2(6- a)' 

Sea no un número natural tal que l/n 0 < S. Podemos exigir además que 
2-no+i < 5 _ a p ara cac [ a x g sea 

m x = ínf {f(t) \ te[x, x' no [ n [a, b}}, 
M x = sup{/(í) | t G [x,x' no [n[a,b]}. 

Estos supremos e ínfimos existen porque / está acotada en [a, b] (por com- 
pacidad). Entendemos que si [a;,x^ 0 [ fl [a, b] = 0 entonces m x = M x = 0. 

Puesto que x' na — x < 2~ n ° < S tenemos que la distancia entre dos valores 
de / en un intervalo [x, x' no [ n [a, b] no es superior a e/2(6 — a), de donde se 
concluye inmediatamente que M x — m x < e/2 (b — a). 

Llamemos g y h a las funciones que en cada intervalo \x, x' [ toman el 
valor constante m x y M x respectivamente. Entonces es claro que g < f < h y 
0<h-g< e/2(b-a). 

Para todo n > n 0 se cumple 

S no (g) - S n (g) < S n (f) < S n (h) = S no (h), 
luego para n, m > no se cumple 

\S n (f) - S m (f)\ < S no (h -g)= Y, (M x - m x )2"™° 
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Si llamamos k al número de puntos x € P„ 0 tales que \x, x' nQ [ C [a, b] es 
claro que k2~ n ° < b — a. Puede ocurrir que haya dos puntos adicionales y € P n 
tal que [y, y' ng [ no esté contenido en [a, b] pero corte a [a, b]. En cualquier caso 
hay a lo sumo k + 2 intervalos que cortan a [a, 6] y por lo tanto la suma anterior 
tiene a lo sumo k + 2 sumandos no nulos. Así pues 

\S n (f) S m (f) \<(k + 2)2-" < e - 

Esto prueba que la sucesión S n (f) es de Cauchy, luego converge, luego / es 
integrable Riemann. ■ 

Conviene introducir el convenio de que 

f f{x) dx=- í f(x) dx, í f(x) dx = 0. 

Ja Jb Ja 

De este modo la fórmula del apartado e) del teorema 6.1 se cumple para tres 
puntos cualesquiera a, b, c independientemente de cómo estén ordenados o de 
si son iguales o no. En particular, si / es una función continua en un intervalo 
/ (no necesariamente acotado) y a £ I podemos definir 



F(x) = íf(t) dt 

Ja 



para todo x € I. Ahora probamos que la integral de Riemann de una función 
continua coincide con la integral calculada mediante una primitiva. 

Teorema 6.3 Sea f una función continua en un intervalo I y sea a € I. En- 
tonces la función 

F(x)= íf{t)dt 

J a 

es derivable en el interior de I y F' = f. 

DEMOSTRACIÓN: Sea x un punto interior de I y sea J C / un intervalo 
cerrado y acotado que contenga a a y a a; (a éste último en su interior). Por 
el teorema 2.36 la función / es uniformemente continua en J, luego para cada 
e > 0 existe un S > 0 tal que si u, u' € J, \u — u'\ < 6 entonces \f(u) — f(u')\ < e. 

Sea h e IR tal que \h\<Syx + h£j. Sean m y M el mínimo y el máximo 
de / en el intervalo cerrado de extremos x y x + h. Si h > 0 

mh= mdt< f(t)dt< / M dt = Mh. 

J X J X J X 

Si h < 0 se invierten las desigualdades, pero en ambos casos resulta 

[ x+h f(t) dt 
h 
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Por el teorema de los valores intermedios existe un a entre x y x + h de modo 
que 

M j h ' 

Claramente \a — x\ < \h\ < S, luego 

F(x + h)- F(x) 



= \f(a)-f(x)\<e, 



h 

por lo que existe F'(x) = f(x). m 
Como consecuencia obtenemos: 

Teorema 6.4 (Regla de Barrow) Si f es una función continua en un inter- 
valo [a, b] entonces F tiene una primitiva F en [a, b] y 



L 



b 

f(x)dx = F(b)-F(a). 



Demostración: Cuando decimos que F es una primitiva de / en [a, b] 
queremos decir que F es continua en [a, b], derivable en ]a, b[ y F' = f en ]a, b[. 
Basta tomar como F la función 



F(x) = J f(t) dt, 



donde a < c < b. Sólo falta probar que F es continua en a y en b, lo cual es 
sencillo: Sea \f(x)\ < M en [a,b]. Entonces 



pb r-b 

\F(b)-F(x)\< / \f(t)\dt< / Mdt = M{b- 

J X J X 



x), 



luego si \b — x\ < S — e/M se cumple \F(b) — F(x)\ < e, lo que prueba la 
continuidad en b, e igualmente sucede con a. ■ 

Puesto que toda función continua tiene primitiva, todo arco x de clase C 1 
es rectificable, pues la función 1 1 a;' | es continua. 

Ejemplo Vamos a demostrar el resultado que dejamos pendiente en el capí- 
tulo III, a saber, la convergencia de la serie de Taylor del arco tangente incluso 
en los puntos frontera ±1. Para ello partimos de la suma parcial de la serie 
geométrica de razón — t 2 : 

i j-2n+2 
- 1 - f + t 4 + • • • + (-í) n t 2n + (-1)" +1 



1+í 2 ' ' ' ' 1 + í 2 ' 

Integrando ambos miembros resulta 

f x 1 , x 3 x 5 . . ^ 

arctanx= / ^ dt = x — + — ■ • • + (— 1) 

Jo ! + 



t 2 3 5 x ' 2n+l 

rx ,2n+2 
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El polinomio de la derecha es el polinomio de Taylor del arco tangente, luego 

rx + 2n+2 



\R2n+l{x) 



rx £¿n+2 rx 

Jo 1 + ** ~ Jo 



t 2n+2 dt 



| x |2n+3 

2n + 3 ' 



de donde se sigue que el resto tiende a cero incluso si x = ±1, como había que 
probar. ■ 

Finalmente definimos la integral de una función / : [a,b] — > IR™ como 
/ f(x)dx=¡ fi(x)dx, / f n (x)dx\, 

J a \J a Ja J 

entendiendo que / es integrable Riemann en [a, b] si y sólo si lo son todas sus 
funciones coordenadas /¿. 



6.2 Ecuaciones diferenciales de primer orden 

Nos ocupamos ahora de asegurar la existencia y unicidad de la solución de 
los problemas de Cauchy. Nos basaremos en un resultado general sobre espacios 
métricos completos: 

Teorema 6.5 (Teorema de punto fijo de Banach) Sea M un espacio mé- 
trico completo y T : M — > M una aplicación tal que existe un número real 
0 < a < 1 de modo que 

d(T(x) 7 T(y)) < ad(x 7 y), para todo x 7 y € M. 

Entonces existe un único x £ M tal que T(x) = x. 

Las aplicaciones T que cumplen la propiedad indicada se llaman contractivas. 
Los puntos x que cumplen T{x) = x se llaman puntos fijos de T. El teorema 
afirma, pues, que toda aplicación contractiva en un espacio métrico completo 
tiene un único punto fijo. 

DEMOSTRACIÓN: Tomamos un punto arbitrario xo £ M y consideramos la 
sucesión dada por x n+1 = T(x n ). Por la propiedad de T, tenemos que 

d(x 1 ,x 2 ) = d(T(x 0 ) 7 T(x 1 )) < ad{x 0 ,xi), 

d(x 2 ,x 3 ) = d(T(xi),T(x 2 )) < ad(xi,x 2 ) = a 2 d(x 0l xi), 

y en general concluimos d{x ni x n+ i) < a™ d(x 0 , xi). Aplicando la desigualdad 
triangular resulta, para n < m, 

/m-l \ / oo \ an 

d(x n , x m ) < í ^2 a% ) d(x 0 ,xi) < í ^2 a% ) x i) = d( ~ a;o ' Xl ^' 
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El término de la derecha tiende a 0, lo que significa que la sucesión x n es de 
Cauchy. Como el espacio M es completo existe x = \ívi\x n G M. Veamos que x 

n 

es un punto fijo de T. Para ello observamos que 

d(x,T(x)) < d(x,x n ) + d(x n ,x n+ i) + d(x n+ i,T(x)) 
< (1 + ot)d(x,x n ) + a n d(x 0 ,xi). 

El último término tiende a 0, luego ha de ser d(x,T(x)) = 0, es decir, 
T(x) = x. Si y es otro punto fijo de T, entonces d(T(x),T(y)) = d(x,y), en 
contradicción con la propiedad contractiva, luego el punto fijo es único. ■ 

Es frecuente que una ecuación diferencial dependa de uno más parámetros. 
Por ejemplo, la fuerza F(t, x) que afecta a un móvil de masa ra es, por lo general, 
función del tiempo t y de la posición x. La segunda ley de Newton afirma que 
su trayectoria x(t) obedece la ecuación diferencial de segundo orden 

F(t,x) = mx"(t), 

donde la masa ra es un parámetro. En casos como este podemos considerar 
la solución como función de los parámetros, es decir, x(t, ra) es la posición en 
el instante t de un cuerpo de masa m sometido a la fuerza F(t, x) (y en unas 
condiciones iniciales dadas) . En el teorema de existencia y unicidad que damos 
a continuación contemplamos la existencia de estos parámetros y probamos que 
la solución depende continuamente de ellos. 

Teorema 6.6 Sean t 0 , a, b\, . . . , b n , y? , . . . , y® números reales. Consideremos 
una aplicación continua 

n 

f:[to- a,t 0 + a]x J]^ 0 - b u y° + b t ] x K — > R n , 

¿=1 

donde K es un espacio métrico compacto. Sea M una cota de f respecto a la 
norma \\ \\oo en R™. Supongamos que existe una constante N tal que 

||/(í,»,A*) -/(*,«, A*) lloo < JV||y- «Hoo- 
Entonces el problema de Cauchy 

y'(t,u) = f{t,y,n) 1 
y{t 0 ,n) = y 0 J 

tiene solución única y : [to — h 0 ,t 0 + h 0 ] x K — > W l , continua en su dominio, 
donde ho es cualquier número real tal que 
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Se entiende que derivada de y que aparece en el problema de Cauchy es 
respecto de la variable t. Teóricamente deberíamos usar la notación de derivadas 
parciales, pero es costumbre usar la notación del análisis de una variable para 
evitar que el problema parezca una ecuación diferencial en derivadas parciales, 
cuando en realidad no lo es. 

Demostración: Sea ho en las condiciones indicadas, sea I = [t — ho,t + ho], 

n 

sea D = Yl [y i ~ y® + bi] y sea M = C(I xK,D), que es un espacio de Banach 
con la norma supremo. Definimos el operador T : M — > M mediante 



T(y)(t,n)=y°+ f f(t,y(t,»),ti)dt. 

Jto 



Hemos de probar que T(y)(t, u.) £ D y que T(y) es una aplicación continua. 
En primer lugar, 



|T(j/) ¿ (í, M )-yO 



/ fi(t,y,n)dt < / \fi(t,y,fj,)\dt 

Jt 0 Jt 0 

M\t - t 0 \ < Mh a < bi. 



< M 


í dt 




Jt 0 



Esto prueba que T(y)(t,n) e D. La continuidad es consecuencia de un 
cálculo rutinario: 



max 



< máx 



+ 



< máx 



to 



/ fi(t,y,i¿i)dt- / fi(t,y,fj, 2 )dt 

Jto Jto 

/•ti ríi 

/ fi(t,y,m)dt- l fi(t,y,n 2 )dt 

Jto Jto 
rti /-Í2 

/ fi(t,y,fj, 2 )dt- / fi(t,y,n 2 )dt 

Jto Jt 0 

{Mt,y,m) - fi(t,y,fJv)) dt 



< máx 



\fi(t,y,m) - fi(t,y,u, 2 )\dt 



[ fi(t,y,u. 2 ) 
Jt 2 

+ M\h -t 2 \. 



Sea e > 0. La función fi(t,y(t, fx), u) es uniformemente continua en el 
compacto I x K, luego existe un S > 0 tal que si d(/íi,/i 2 ) < 5, entonces 
\fi(t,y, fii) — fi(t,y, i¿ 2 )\ < e/2h 0 - Podemos suponer que esto vale para todo 
i = 1, . . . , n, y si suponemos también que |íi — t 2 \ < e/2M concluimos que 

\\T{y){t u nx)-T{y){t2,^)\\ 00 <e. 

Esto prueba la continuidad de T(y) en el punto (íi,/zi). 



6.2. Ecuaciones diferenciales de primer orden 



241 



Ahora probamos que T es contractivo, con constante a = Nh 0 < 1. En 
efecto, 



\\T(y)(t,ii)-T(z)(t,ii)\\ 00 = máx 



í (fi(t,y(t,»),iJ,) - fi(t,z(t,n),n)) dt 

Jto 



< máx 



N\\y(t,u) - ^(í.^lloodí 



to 



< N máx 



í \\y-z\\dt 

Jto 



<Nh 0 \\y 



Por definición de norma supremo resulta \\T(y) — T(z)\\ < a\\y — z\\. El 
teorema anterior implica ahora la existencia de una única función y € Al tal 
que 

y(t,u,) = y°+ í f(t,y,fi)dt, 



pero es claro que esto equivale a ser solución del problema de Cauchy, luego éste 
tiene solución única. ■ 

En la práctica, hay una hipótesis más fuerte que la condición de Lipschitz 
que hemos exigido en el teorema anterior pero que es más fácil de comprobar. 
Se trata de exigir simplemente que la función / sea de clase C l . 

Teorema 6.7 Sea / : D C 1" — > R m una función de clase C 1 en un abierto 
D. Para todo subconjunto compacto convexo C C D existe una constante N tal 
que si y, z G C entonces \\f(y) - /(z)^ < N\\y - z^. 

DEMOSTRACIÓN: Si llamamos /i, . . . , f m a las funciones coordenadas de /, 
basta probar que \fi(y) — fi(z)\ < Ni\\y — para todo y, z € C, pues to- 
mando como N la mayor de las constantes N t se cumple la desigualdad buscada. 
Equivalentemente, podemos suponer que m = 1. 

Dados y, z G C, consideramos la función g(h) — f(y + h(z — y)) , definida en 
[0, 1], pues C es convexo. Se cumple g(0) — f(y), g(í) = f(z). Por el teorema 
del valor medio existe 0 < h 0 < 1 tal que 

/(*) - f(v) = SÍ(ho) = df(0(z -y) = V/(0(z - y), 

donde £ = y + h 0 (z — y) £ C. Sea una cota del módulo de las derivadas 
parciales de / (que por hipótesis son continuas) en el compacto C. Entonces 



\f(z)-f(y)\ = 



1=1 



< ^2n 0 \\z - j/Hoo = n7V 0 ||z - yW^. 
í=i 



En realidad, si tomamos como hipótesis que la ecuación diferencial sea 
de clase C 1 obtenemos no sólo la continuidad de la solución respecto de los 
parámetros, sino también la derivabilidad. 
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Teorema 6.8 Sea f : D C R x R n x R m — > R n una función de clase C 1 en el 
abierto D. Sea (Í0)2/Oj/-0 € -D- Entonces el problema de Cauchy 

y' (t,fj) = f(t,y,fj) 
í/(*o,m) = yo 

¿¿ene solución única definida y de clase C 1 en un entorno de (fo,£t). 

Demostración: Tomamos un entorno C de (ío, yo. A 4 ) que esté contenido en 
D y sea producto de intervalos cerrados de centro cada una de las componentes 
del punto. En particular es convexo y compacto. El teorema anterior garantiza 
que se cumplen las hipótesis del teorema de existencia y unicidad. Falta probar 
que la función y(t, /i) es de clase C 1 en su dominio. 

Obviamente y es derivable respecto de t y la derivada es continua. Veamos 
que lo mismo sucede con las demás variables. Sea e¿ un vector de la base 
canónica de IR™. Consideramos un punto (ti, ¿ti) del dominio de y. La función 

Q(t,^h)= y{t ^ + he ^- yit ^ ) 

está definida en los puntos de un entorno de (íi,/xi,0) para los que h ^ 0. 
Hemos de probar que tiene límite cuando h tiende a 0. Claramente 

dQ = f(t,y(t,fi+hei),n + hej) - f(t,y(t,fj,),fj.) 
dt h 

Llamemos 

f{p + x)-f{p)-df{p){x) Q 
E{p,x)={ \\x\\ 

0 si x = 0 

Se comprueba que es continua en un entorno de (ti, y(t\, ¿ti), ¿íi, 0). Sólo 
hay que ver la continuidad en los puntos de la forma (^,0). Se demuestra para 
cada función coordenada independientemente, y a su vez para ello se aplica el 
teorema del valor medio la la función fj(p + tx). El resultado es que 

E j (p,x) = (Vf j (p>)-Vf j (p))^, 

donde p' es un punto entre p y p + x, y ahora basta aplicar la continuidad de 
las derivadas parciales de /. 
En términos de E tenemos 

dQ 

-t^t = df(t,y(t, n), fi)(0,Q(t, fj,,h),ei) 
+ H(0, Q(t, fx, h), 1)|| M E(Q, y(t, fi + he t ) - y(t, n),h). 
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Más brevemente 

^ = df(t, y(t, /i), /i) (O, Q(t, fj,, h),ei) + ||(0, Q(í, n, h), 1)|| £T(í, M , fr), 

entendiendo que E*(t,[i,h) es continua en un entorno de (¿i , /Lti , 0) y se anula 
en los puntos donde ft, = 0. 

Esto significa que Q es la solución de una ecuación diferencial determinada 
por la función continua 

g(t, Q, fi, h) = df(t, y(t, /i), A*) (0, Q, e¿) + || (0, Q, 1) || (í, M , &), 

donde /i y h son parámetros. Esta función no es diferenciable, pero cumple 
claramente la hipótesis del teorema 6.6. Concretamente la consideramos definida 
en un producto de intervalos de centros t\, Q(íi, ¡j,\, h) (para un h fijo) por 
un entorno compacto K de (fj,i,h) que contenga a (/¿i,0). Si tomamos como 
condición inicial en el punto (ti, n\, h) la determinada por la función Q que ya 
tenemos definida, el teorema 6.6 nos garantiza la existencia de solución continua 
en un conjunto de la forma [íi —r,t\+r\ x K. Por la unicidad la solución debe 
coincidir con la función Q que ya teníamos. En particular coincidirá con ella 
en los puntos de un entorno de (íi,/ii,0) tales que h ^ 0. De aquí se sigue que 
existe 

dy 

Km Q(ti,/j,i,h) = ^— (ti, Mi). 
Más aún, esta derivada satisface la ecuación diferencial 

Esto implica que es continua, luego y es de clase C 1 . ■ 

Hemos probado que las derivadas respecto a los parámetros de una ecuación 
diferencial determinada por una función de clase C k satisfacen una ecuación 
diferencial de clase C fe_1 . Una simple inducción prueba entonces que la solución 
y de una ecuación de clase C k es una función de clase C k . 

Notemos que la solución y de un problema de CaucKy puede considerarse 
también como función de las condiciones iniciales, es decir, y(t, ¿i, ío, Vo)- Del 
teorema anterior se deduce que y es continua respecto a todas las variables, es 
decir, como función definida en un entorno de (ío, fJ,, ío, yo) en M x R m xRx K™. 
Para ello basta ver que si Kacemos z = y(t, ¡i, t 0 , yo)-i/oy = t — to, el problema 

y'(t) = f{t,y,n) 

y(to) = yo 

es equivalente a 

z'(r) = f(r + í 0 ,z + y 0 ,M) \ 
z(0) = 0 / 

en el sentido de que una solución de uno da una del otro mediante los cambios de 
variable indicados. El segundo miembro del segundo problema es una función 
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g{r,z,v), donde v = (íoiJ/o^A 4 ) <= D. Concretamente, el dominio de g es el 
abierto 

{(Y, z, t 0 , y 0 , A*) I (r + t 0 , z + yo, /z) € D, (í 0 , yo, A*) € xi- 
lina solución z del segundo problema definida en un entorno de (0, ío, yo, A*) 
se traduce en una solución y(t, ¡i, to, yo) del primer problema definida en un 
entorno de (to, ¡i, to, yo)- En definitiva tenemos el siguiente enunciado, más 
completo, del teorema de existencia y unicidad: 

Teorema 6.9 Sea f : D C R x R n x R m — > R n una función de clase C k 
(k > l) en el abierto D. Sea (t 0 ,yo,n) € D. Entonces el problema de Cauchy 

y'(t,fi,t 0 ,yo) = f(t,y,n) 1 
y(t 0 ,n,t 0 ,yo) = yo J 

tiene solución única de clase C k en un entorno de (to, H, to, yo)- 

Conviene interpretar las ecuaciones diferenciales de primer orden en términos 
cercanos a las aplicaciones físicas. Supongamos que D es una región del espacio 
ocupada por un fluido en movimiento, como puede ser el aire o un caudal de 
agua. Podemos considerar entonces la función K:/xDclxl™ — > R n que 
determina la velocidad del fluido Vt (x) en cada instante t <E / y en cada punto 
x £ D. Es lo que se llama un campo de velocidades variable. Si V no depende 
de t tenemos un campo de velocidades estacionario. Entonces, la solución del 
problema de Cauchy 

x'(t) =V t (x{t))\ 
x(t 0 ) = Xo J 

se interpreta como la trayectoria que seguirá un cuerpo de masa despreciable (un 
papel en el aire) abandonado en el punto Xo en el instante ¿o- Las soluciones 
se llaman líneas de flujo del campo de velocidades. Estos problemas son el 
objeto de estudio de la hidrodinámica, o mecánica de fluidos. Observemos que 
cualquier problema de Cauchy puede interpretarse de este modo, lo cual es 
conveniente en muchas ocasiones. La función x(t, ¡jl, to, yo) dada por el teorema 
anterior se conoce como flujo del campo de velocidades. Cuando el campo es 
estacionario el instante inicial ío es irrelevante, pues claramente x(t, ¡i, to, yo) = 
x(t — 1 0 , yu, 0, yo) , por lo que podemos suponer siempre que ío = 0 y entender que 
el flujo x(t, fx, yo) indica la posición de un objeto sometido al campo t unidades 
de tiempo después de que se encontrara en la posición y 0 - 

Otra cuestión importante es el dominio de la solución y(t) (para unos pará- 
metros y condiciones iniciales dados). En principio hemos probado que la 
ecuación tiene solución única en un entorno de ío, pero una solución dada en un 
entorno dado puede admitir prolongaciones a un intervalo mayor. Haciendo uso 
de las estimaciones explícitas del teorema 6.6 junto con la unicidad de las solu- 
ciones es fácil ver que dos prolongaciones de una misma solución han de coincidir 
en su dominio común, luego la unión de todas las prolongaciones constituye una 
solución máxima, no prolongable, de la ecuación diferencial. El dominio de esta 
solución máxima ha de ser un intervalo abierto, sin que pueda prolongarse por 
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continuidad a sus extremos, o de lo contrario podríamos usar el teorema de 
existencia para prolongar la solución un poco más tomando como condiciones 
iniciales los valores en dicho extremo. Si el dominio de la solución máxima está 
acotado superior o inferiormente, ello se debe necesariamente a que la curva 
obtenida tiende a infinito en el extremo o bien se acerca a la frontera del abierto 
donde está definido el problema. No entraremos en detalles sobre esto. 

Como ejemplo de aplicación del teorema anterior demostramos lo siguiente: 

Teorema 6.10 Dadas dos funciones k,t : I — > R de clase C 2 de modo que 
k > 0 y un punto í 0 £ /, existe una curva regular x : ]t(¡ — e,t 0 + e[ — ► R 
parametrizada por el arco tal que k y r son respectivamente su curvatura y su 
torsión. La curva es única salvo isometrías. 

Demostración: La unicidad nos la da el teorema 4.23. Para probar la 
existencia consideramos el sistema de ecuaciones diferenciales determinado por 
las fórmulas de Frenet: 

T' = kN, N' = -kT - tB, B' = tN. 

Se trata de un sistema de nueve ecuaciones diferenciales con incógnitas las 
nueve funciones coordenadas de T, N y B. Tomamos unas condiciones iniciales 
cualesquiera Tq, Nq, Bq tales que formen una base ortonormal positivamente 
orientada. Por el teorema anterior existen unas únicas funciones (T, B, N) que 
satisfacen las ecuaciones. Un simple cálculo nos da 

(TN)' = kNN - kTT -tTB, (TB) 1 = kNB + tTN, 
(NB)' = -kTB -tBB + tNN (TT)' = 2kTN, 
(NN)' = -2kTN -2tNB (BB)' = 2tNB. 

Vemos que las seis funciones TN, TB, NB, TT, NN, BB satisfacen un 
sistema de ecuaciones diferenciales con la condición inicial (0, 0, 0, 1, 1, 1) que por 
otra parte es claro que tiene por solución a la función constante (0, 0, 0, 1, 1, 1). 
La unicidad implica que (T, TV, B) es una base ortonormal de R 3 . 

Definimos 

x(s) = / T(s)ds. 

Jt a 

Entonces es claro que x'(s) = T(s), luego en particular x está parametrizada 
por el arco. Además x"(s) = kN, luego k es la curvatura de x. Un simple cálculo 
nos da que la torsión es r. ■ 

Veamos ahora una aplicación a las variedades diferenciables. Sea S C K TO 
una variedad de dimensión n y a : I — > S una curva parametrizada por el 
arco. Sea o¿(sq) = p. Sea X una carta de S alrededor de p. Entonces a tiene 
asociada una representación en la carta x(s) de modo que a(s) — X(x(s)). Un 
vector arbitrario wo € T P (S) es de la forma wo — dX(x(so))(ao). Teniendo en 
cuenta las ecuaciones (5.8) del capítulo anterior es claro que la solución a(s) del 
problema 

n 

«fe + a F% x 'i = 0 
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con la condición inicial a(s 0 ) — a 0 determina un campo de vectores 

w(s) = ai(s) D 1 X(x(s)) + ■■■ + a n {s) D n X(x(s)) 

con derivada covariante nula. Con esto casi tenemos demostrado el teorema 
siguiente: 

Teorema Sea S una variedad y a : I — > S una curva parametrizada por 
el arco. Sea a(s 0 ) = p y sea w 0 € T p (S). Entonces existe un único campo 
w : I — > IR 3 tal que w(s) £ T a ^(S), w(s 0 ) = vüq y Dw = 0. Lo llamaremos 
transporte paralelo de wq a través de a. 

En realidad hemos probado la existencia de w en un entorno de So- Vamos 
a justificar que la solución puede prolongarse a todo I. Para ello conviene 
observar que al ser Dw = 0 tenemos que w'(s) es perpendicular a T a ^(S), 
luego (ww)' = 2ww' — 0, es decir, \\w\\ es constante. De aquí se sigue que el 
transporte paralelo es único: si w y w' son transportes paralelos de un mismo 
vector, entonces w — w' es un transporte paralelo del vector nulo (porque su 
derivada covariante es la resta de las de los dos campos, luego es nula) , luego es 
la aplicación constantemente nula. 

Acabamos de usar la linealidad de la derivada covariante. Más en general, 
si tenemos dos vectores wq, Wq £ T p (S) y ambos tienen transporte paralelo w y 
w' , entonces aw + ¡3w' es un transporte paralelo de awo + (3w' Q . Según lo que 
sabemos, existe un entorno de so a 1° largo del cual todos los vectores de una 
base de T p (S) tienen transporte paralelo, con lo que de hecho todos los vectores 
de T P (S) lo tienen. 

Dado cualquier s £ I, es claro que el intervalo [s 0 ,s] (o [s,s n ] si s < s 0 ) 
puede cubrirse con un número finito de estos entornos donde existe transporte 
paralelo, de donde se sigue inmediatamente la existencia de transporte paralelo 
desde s 0 hasta s, luego el transporte paralelo existe sobre todo /. ■ 

Definición 6.11 Sea S una variedad y a : [sq, si] — > S una curva parametri- 
zada por el arco de extremos p y q. Según el teorema anterior, para cada vector 
w 0 € T P (S) tenemos definido el transporte paralelo w(s) a lo largo de a de modo 
que w(so) = w 0 . Al vector tp pq (wo) = w(si) € T q (S) lo llamaremos trasladado 
de u>o a lo largo de a. Esto nos define una aplicación tp pq : T p (S) — > T q (S) a 
la que llamaremos transporte paralelo de T p (S) a T q (S) a lo largo de a. 

Ejercicio: Probar que el transporte paralelo tp™ q : T P (S) — > T q (S) es una isometría. 

6.3 Ecuaciones diferenciales de orden superior 

Las ecuaciones diferenciales que aparecen con mayor frecuencia en física y en 
geometría son de orden 2. Afortunadamente, toda la teoría sobre existencia y 
unicidad que vamos a necesitar para ecuaciones diferenciales de orden superior 
se deduce inmediatamente del caso de orden 1. En efecto: 
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Teorema 6.12 Sea f : D C 



función de clase C k 



con k > 1 en un abierto D. Entonces la ecuación diferencial 



y m) (t) 


= f(t,y,y',- 




y(t 0 ) 


= yo 




y'(t 0 ) 


= y'o 




y m - 1] {h) 


= yo _1) 





tiene solución única y(t, ¡jl, to, yo, y 0 , . . . , y™ ^) de c/ase C fe en un entorno de 
cada punto (t 0 , ¿o, 2/0, 2/ó , • • ■ , y™ - ^)- 

DEMOSTRACIÓN: Basta observar que el problema equivale al sistema de 
ecuaciones de primer orden 

y'{t) = yi 
y[(t) = y2 



24-20) = Vm-l 

y'm-iW = f(t,y,yi,---,y m -i,i¿) 

,.m— 1\ 



(y,yi,...,y m -i)(t 0 ) = (yo,2/ 0 > • • • >2/ó™ ) 



donde hemos introducido las variables auxiliares y i, que representan funciones 
con valores en W 1 . Todo este sistema se puede expresar como una única ecuación 
vectorial en las condiciones de la sección anterior. ■ 



Ejemplo Vamos a calcular todas las soluciones de la ecuación 
y"(t) = *y'(t), keR,t>0. 

Obviamente las funciones constantes son soluciones de la ecuación. Si y no 
es constante existe un punto t 0 > 0 tal que y'{t 0 ) ^ 0. Llamemos y\ = y'(t). 
En un entorno de to tenemos 

y'Át) = k 

Vi(t) i' 
luego integrando entre t 0 y t queda 

logyi(í) - logy(ío) = logx fe , 

de donde yi(t) — yi(t 0 )x k , es decir, y'(t) = y'(t 0 )x k . Integrando de nuevo 
concluimos que 

*) = < í+í + 

y'(t 0 )logt + y(t 0 ) si fc = — 1 
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Ahora es claro que las soluciones de la ecuación dada están todas definidas 
en ]0, +oo[ y vienen dadas por 



Estas expresiones incluyen las funciones constantes, que habíamos dejado aparte. 

■ 

El análogo de segundo orden a un campo de velocidades sería un campo de 
aceleraciones, pero en física resulta más natural hablar de campos de fuerzas. 
Es frecuente que la fuerza F t (x) que actúa sobre un cuerpo en un instante dado 
dependa únicamente de su posición en el espacio, con lo que tenemos una función 
F : I x D — > IR™. El campo de fuerzas será estacionario si no depende del 
tiempo. De acuerdo con la segunda ley de Newton, la trayectoria x(t) de un 
cuerpo de masa m sometido a este campo vendrá determinada por la ecuación 
diferencial 



La solución depende de la posición inicial Xq y la velocidad inicial v 0 . 

Ejemplo La ley de la gravitación universal de Newton afirma que la fuerza 
con que se atraen mutuamente dos cuerpos es directamente proporcional a sus 
masas e inversamente proporcional al cuadrado de la distancia que los separa. 
Consideremos una región del espacio donde haya un cuerpo S de masa M tan 
grande que la masa de cualquier otro cuerpo en las proximidades resulte despre- 
ciable. Es el caso del Sol, rodeado de planetas de masa insignificante a su lado, 
o de la Tierra y sus alrededores. En tal caso podemos suponer que la única 
fuerza que actúa sobre un cuerpo es la provocada por S. En efecto, cuando de- 
jamos caer un objeto nuestro cuerpo lo atrae por gravedad, pero esta atracción 
es completamente inapreciable frente a la gravitación terrestre. Igualmente, 
Júpiter atrae gravitatoriamente a la Tierra, pero la fuerza con que lo hace es 
insignificante frente a la del Sol. 

Si tomamos un sistema de referencia con origen en el punto donde se halla 
el objeto masivo S, la fuerza que experimenta otro cuerpo de masa m situado 
en un punto x viene dada por 

GMm 

IfII 

donde G = 6,672 • 10~ n N • m 2 /Kg 2 es la constante de gravitación universal. El 
hecho de que su valor sea tan pequeño hace que la gravedad no se manifieste 
salvo en presencia de grandes masas, como las estrellas y los planetas. 

Tras estudiar minuciosamente una gran cantidad de observaciones astronó- 
micas, en 1610 Kepler publicó su astronomía nova, donde concluía que los pla- 
netas se mueven siguiendo órbitas elípticas, de modo que el Sol ocupa uno de 
los focos. Esta es la primera ley de Kepler. Newton mostró que éste y muchos 
otros hechos sobre el movimiento de los astros pueden deducirse a partir de las 




Ax k+1 + B si fe ± -1 
Alogí + B si fe = — 1 



F t = 



mx 



,n 
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leyes básicas de la dinámica y de su ley de gravitación. Vamos a comprobar 
que las trayectorias de los objetos sometidos a un campo de fuerzas como el que 
estamos considerando son rectas o secciones cónicas. 

En primer lugar, es claro que si un cuerpo se encuentra en un punto x 0 
en las proximidades del Sol con una velocidad vq, su trayectoria no saldrá del 
plano determinado por los vectores x 0 y v 0 (o de la recta que determinan, si 
son linealmente dependientes). Por ello podemos tomar el sistema de referencia 
de modo que el eje Z sea perpendicular a este plano, con lo que la trayectoria 
cumplirá z = 0 y podemos trabajar únicamente con las coordenadas (x,y). 

Conviene introducir coordenadas polares, r = (x, y) = (p cos9, p send). En 
general, cuando la trayectoria de un móvil viene dada en coordenadas polares 
por unas funciones p(t), 9(t), se llama velocidad angular a la derivada lo = 9' . 
La segunda derivada a = u>' = 9" se conoce como aceleración angular. 

La ecuación de Newton puede expresarse en términos de la cantidad de mo- 
vimiento, definida como p = mv, donde v = r' es la velocidad del móvil y m es 
su masa. Admitiendo que ésta es constante, la segunda ley de Newton afirma 
que 

F- ^ 
dt 1 

donde F es la fuerza total que actúa sobre el cuerpo. En particular, la cantidad 
de movimiento de un cuerpo sobre el que no actúa ninguna fuerza permanece 
constante. 

Existen magnitudes análogas a la cantidad de movimiento y la fuerza en 
coordenadas polares. Se llama momento angular de un móvil a la magnitud 
L = r hp = mr Av. Si la trayectoria está contenida en un plano el vector L 
es perpendicular a él. Veamos su expresión en coordenadas polares. Para ello 
calculamos: 

v = //(eos 9, sen 9) + poj(— sen 9, eos 9), (6.1) 

de donde 

L = mp(cos 0, sen 0) A puj(— sen 9, eos 9, 0) = (0, 0, rap 2 u;). 

Para un movimiento plano podemos abreviar y escribir L = mp 2 uj. Se define 
el momento de una fuerza F que actúa sobre un móvil de posición r como 
M = r A F. Es claro que si sobre un cuerpo actúan varias fuerzas el momento 
de la fuerza resultante es la suma de los momentos. La versión angular de la 
segunda ley de Newton es 

dL r, 

— — = mv A v + r A ma = r A b = M, 

dt 

es decir, el momento total que actúa sobre un móvil es la derivada de su momento 
angular. En particular, si un cuerpo está libre de toda fuerza su momento 
angular permanece constante. Sin embargo, el momento angular se conserva 
incluso en presencia de fuerzas, con tal de que la fuerza resultante sea paralela 
a la posición, como ocurre en el caso de la fuerza gravitatoria que el Sol ejerce 
sobre los planetas. 
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Esto ya nos da una información sobre el movimiento de los planetas: puesto 
que mp 2 ui ha de ser constante, los planetas giran más rápidamente cuando están 
más cerca del Sol. 

Veamos ahora la expresión de la segunda ley de Newton para la gravitación 
en coordenadas polares. Calculamos la aceleración 

a = v' = (p" — pu> 2 ) (eos 0, sen 9) + (2p'uj + pa)(— sen 9,cos9). 

La fuerza gravitatoria es 

GMm 

F = — (eos 0, sen 9). 

P 

Teniendo en cuenta que los vectores (eos 9, sen 9) y (— sen 0, eos 0) son orto- 
gonales,^ ecuación F = ma equivale a las ecuaciones 

p" - P lü 2 = - < =^, 2 P 'uj + pa = 0. (6.2) 

La solución es complicada, pero ahora estamos interesados únicamente en la 
forma de la trayectoria, aunque sea con otra parametrización. Por ello, en lugar 
de calcular las funciones p(t) y 9(t) calcularemos la parametrización p(9). Por 
supuesto hay un caso en el que esta parametrización es imposible. Si loq = 0 
(lo cual equivale a que la velocidad inicial t>o sea nula o paralela a ro) entonces 
es fácil ver que la solución de las ecuaciones es una recta de la forma (p(í), #o)> 
donde p está determinada por la ecuación 

„ GM 

P 2 

con las condiciones iniciales p 0 y p' 0 , determinadas a su vez por r 0 y v 0 . En 
efecto, una trayectoria de este tipo cumple u> = a = 0 y satisface trivialmente 
las ecuaciones. En definitiva, el cuerpo se aleja del Sol en línea recta o bien cae 
sobre él. Hemos probado que si la trayectoria de un móvil cumple u(t) = 0 en 
un instante t entonces u¡ = 0 en todo instante, luego, recíprocamente, si ojq ^ 0 
entonces ui no se anula nunca. Esto hace que la función 9(t) sea un cambio de 
parámetro, luego podemos considerar la reparametrización p(9). Claramente 

P' = Pe^ Y P" = Pe^ 2 + Pe a - 

Sustituimos estas igualdades en (6.2) y eliminamos a en la primera usando 
la segunda. El resultado es la ecuación 

„ 2p' 2 \ 2 GM 



donde ahora todas las derivadas son respecto de 9 y no respecto de t. No obs- 
tante, la presencia de w nos obliga a considerar ambos miembros como funciones 
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de t (la expresión entre paréntesis es una función de 9 compuesta con la función 
<?(*))■ 

Sin embargo, al multiplicar ambos miembros por m 2 p 4 queda 
1 ( „ ^P' 2 \ GMm 2 

7{ p —y- ')=—[?-> (6 - 3) 

donde L = mp 2 uo es una constante, luego todo el segundo miembro es constante y 
la igualdad sigue siendo válida si consideramos el primer miembro como función 
de 9. 

Recordemos que si r es una recta y F un punto exterior, la cónica de directriz 
r y foco F está formada por los puntos tales que la razón entre las distancias a 
r y a F es constante (y recibe el nombre de excentricidad de la cónica). Toda 
cónica que no sea una circunferencia es de esta forma. Si suponemos que el foco 
es el origen y la directriz es la recta vertical x = p > 0, entonces la distancia 
de un punto de coordenadas polares (p, 9) a la directriz es \p — pcos 9\, luego la 
ecuación de la cónica de excentricidad e es 

P 

= e. 



p — p eos 9 



En principio faltaría un valor absoluto. Si e < 1 tenemos una elipse o 
una parábola y podemos suprimirlo, pues la curva queda al mismo lado de la 
directriz que el foco. Si e > 1 tenemos una hipérbola, y al suprimir el valor 
absoluto estamos quedándonos con una de sus ramas. Lo hacemos así porque 
los cuerpos que se mueven siguiendo trayectorias hiperbólicas tienen al Sol en el 
foco correspondiente a la rama que siguen o, dicho de otro modo, que la rama 
que eliminamos no va a ser solución de la ecuación diferencial. Despejando p y 
llamando r = pe queda 



l + ecos((9 + fc)' 

La constante k equivale a girar la cónica, de modo que ahora la directriz 
es arbitraria. Cualquier curva de esta forma es una cónica de excentricidad e. 
Además esta expresión incorpora también a las circunferencias, para las que 
e — 0. Es fácil calcular 

p' = 6 -y sen(# + ¡fe), p" = 2 ^¿- sen 2 (0 + k) + ^ cos(í? + ¡fe). 

Al sustituir en el miembro izquierdo de (6.3) se obtiene sin dificultad el valor 
— 1/r, luego concluimos que la cónica 

T 9 

(l + ecos^ + fc))" 1 



GMm 2 



satisface (6.3). Sólo queda probar que éstas son las únicas soluciones posibles o, 
lo que es equivalente, que hay una solución de esta forma cualesquiera que sean 
las condiciones iniciales po, 9o, p' a , too- Basta ver que las ecuaciones 

L 2 /„ ír¡ , GMm 2 pl ln 
Po = GMm 2 í 1 + ecos (^o + k)) , p 0 = — 2 esen(6»o + fc) 
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tienen solución en e > 0, k para todos los valores de po, 9o, p' 0 , <jJq, pero susti- 
tuyendo L = mpQÜúo estas ecuaciones equivalen a 

e (cos(tf 0 + fc),sen(0 o + *)) = - 1, ^ 

que obviamente tienen solución. Con esto hemos probado que las trayectorias 
de los objetos sometidos a la atracción de una masa fija puntual son rectas o 
secciones cónicas. ■ 



Ejemplo Sea S una variedad diferenciable, sea ¡)£Syii)£ T p (S) un vector 
unitario. Sea X una carta alrededor de p, p = X(xq) y w = dX(x' 0 ). Entonces 
existe una única curva x(t) que verifica las ecuaciones (5.10) del capítulo anterior 
con las condiciones iniciales x(0) — x 0 , x'(0) = x' 0 . La curva g(t) = X(x(t)) 
es una geodésica de S parametrizada por el arco tal que g(0) = p y g'(0) = w. 
Recíprocamente, la representación en la carta de cualquier geodésica que cumpla 
esto ha de ser solución de las ecuaciones (5.10), luego g es única (salvo cambio 
de parámetro). En resumen: 

En una variedad, por cada punto pasa una única geodésica en cada 
dirección. 

Por ejemplo, en el capítulo anterior probamos que los círculos máximos son 
geodésicas de la esfera. Puesto que por cada punto y en cada dirección pasa un 
círculo máximo, concluimos que los círculos máximos son las únicas geodésicas 
de la esfera. ■ 



*Ejemplo En el capítulo anterior demostramos que las rectas elípticas e hi- 
perbólicas son geodésicas de los planos elíptico e hiperbólico. Puesto que por 
cada punto y en cada dirección pasa una única recta, ahora podemos concluir 
que las rectas son las únicas geodésicas. ■ 



Capítulo VII 

Teoría de la medida 



Pensemos en el concepto de área de una figura plana F. Una primera apro- 
ximación consiste en definir dicha área n(F) como el número de veces que F 
contiene al cuadrado de lado unidad, pero esta definición sólo es aplicable si 
F es unión de un número finito de cuadrados unitarios. Por ejemplo, si F es 
un rectángulo de lados m y n (naturales) entonces n(F) — mn. Si F es un 
rectángulo de lados racionales r = p/q y r' = p'/q', es fácil concluir que el 
área del rectángulo de lados p y q ha de ser qq' veces el área de F, de donde 
¡i(F) — rr' . Si F es un rectángulo de lados arbitrarios a y (3, ya no podemos 
compararlo directamente con cuadrados unitarios y hemos de recurrir a un ar- 
gumento de continuidad: si r < a < r' , s < ¡3 < s' son números racionales, 
el área de F ha de ser mayor que el área de un rectángulo de lados r y s y 
menor que la de un rectángulo de lados r' y s', es decir, rs < n(F) < r's'. El 
único número real posible es (jl(F) — a(3. Una vez determinada el área de un 
rectángulo arbitrario, existen numerosos y elegantes argumentos que nos permi- 
ten calcular el área de muchas figuras, basados en que el área se conserva por 
isometrías así como en un principio elemental: 

Si F n G = 0, entonces fj,(F U G) = fj,(F) + fi(G). (7.1) 

Es fácil calcular el área de un paralelogramo, de un triángulo, de un polígono 
regular arbitrario, etc. Sin embargo, para calcular el área de figuras más com- 
plicadas, como pueda ser un círculo, necesitamos de nuevo argumentos de con- 
tinuidad. Por ejemplo, si llamamos P n al polígono regular de 2™ lados inscrito 
en un círculo C y con un vértice en un punto prefijado, es fácil ver que 

oo 

P 2 CP 3 CP 4 C---C, y C= [jP n , 

n=2 

y en estas circunstancias es natural considerar que 

H(C) = sup/x(P„). 



253 



254 



Capítulo 7. Teoría de la medida 



Admitiendo (7.1), es fácil ver que el hecho de que el área de la unión de 
una sucesión creciente de conjuntos sea el supremo de las áreas es equivalente 
a que el área de una unión disjunta numerable de conjuntos sea la suma de 
sus áreas. Este principio engloba a (7.1) y es suficiente para justificar todos 
los razonamientos sobre cálculo de áreas. Con él como única base podemos 
justificar la existencia y el cálculo de áreas de una amplia familia de figuras. 
Sin embargo no nos capacita para definir el área de cualquier subconjunto de 
IR 2 . Existen problemas técnicos para ello en los que no vamos a entrar, pero lo 
cierto es que sólo podremos definir una función área /i : M — > [0, +oo] sobre 
una cierta familia M, que contendrá a todos los círculos, triángulos, etc., pero 
que no será todo el conjunto de partes de IR 2 . 

Conviene introducir una nueva estructura matemática que recoja estas ideas 
y nos permita extenderlas a otras situaciones análogas (el volumen en IR 3 , el 
área en una superficie, etc.) 

7.1 Medidas positivas 

Definición 7.1 Sea X un conjunto. Un álgebra de subconjuntos de X es una 
familia A de subconjuntos de X tal que: 

a) 0,X e A. 

b) Si A e A, entonces X \ A e A. 

c) Si A, B e A, entonces A U B, A n B e A. 

Observar que la propiedad b) hace que la propiedad c) para uniones implique 
la parte para intersecciones y viceversa. Si dicha propiedad se cumple para 
familias numerables entonces se dice que A es una a-álgebra. 

Una mediáa positiva (o simplemente una medida) en una cr-álgebra A de sub- 
conjuntos de X es una aplicación : A — > [0, +oo] que cumpla las propiedades 
siguientes: 

a) ¿i(0) = 0. 

b) Si {Aij-J^Lo es una iam üi a de conjuntos de A disjuntos dos a dos, entonces 

(oo \ oo 

U A A =J2^ A n)- 
n=0 ) n=0 

Los conjuntos de A se llaman subconjuntos medibles de X. Un espacio 
medida es una terna (X, A, fx), donde A es una cr-álgebra de subconjuntos de X 
y jU es una medida en A. En la práctica escribiremos X en lugar de (X,A, y). 

La medida fx es unitaria si (i(X) = 1, es finita si 0 < fi{X) < +oo y es 
a-finita si n(X) > 0 y existen conjuntos medibles {A n }^ =0 de medida finita 
tales que 

oo 

X = U A n . 

n=0 
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Éste último es el caso del área en el plano o el volumen en el espacio. El área 
del plano es infinita, pero podemos descomponerlo en una unión numerable de 
bolas de área finita. También se habla de espacios medida unitarios, finitos o 
cr-finitos, según sea la medida definida en ellos. 

La e-álgebra más simple es la formada por todos los subconjuntos de X, pero 
ya hemos comentado que no podremos definir medidas interesantes sobre ella. 
Es claro que la intersección de una familia de er-álgebras sobre un conjunto X 
es de nuevo una cr-álgebra, por lo que dado G C X existe una mínima cr-álgebra 
que contiene a G. Se la llama cr-álgebra generada por G. Si X es un espacio 
topológico, la a-álgebra generada por los conjuntos abiertos recibe el nombre 
de a-álgebra de Borel. Una medida definida sobre la cr-álgebra de Borel de un 
espacio topológico X recibe el nombre de medida de Borel en X. 

Las propiedades siguientes de las medidas se deducen inmediatamente de la 
definición. Usamos el convenio de que si a € K entonces a+oo = +00+00 = +00. 

Teorema 7.2 Sea X un espacio medida. 

a) Si A C B son medibles entonces ¡jl(á) < ¡-i{B). 

b) Si A C B son medibles y fJb{A) < +00, entonces a(B \ A) = fi(B) — fi(A). 

c) Si A y B son conjuntos medibles disjuntos n{A U B) = fi{A) + fi{B). 

d) Si A y B son medibles entonces u(A U B) < fi{Á) + fi(B). 

e) Si {A n }^L 0 son medibles entonces 

/ 00 \ 00 



|J A n <J2^ A n)- 



\n=0 / n=0 

f) Si {A n }^ =a son medibles y cada A n C A n+ \, entonces 



c Na. = sup/i(A„). 

Vn=0 / 

g) Si {^4„}^L 0 son medibles, cada A n+ i C A n y l-i(Ao) < +00, entonces 

H\ f]A n ) =Mu(A n ). 

Por ejemplo, para probar el último apartado aplicamos el anterior a los 
conjuntos A a \A n . 

Los conjuntos de medida cero se llaman conjuntos nulos. Si A es un conjunto 
nulo y B C A o bien B no es medible o bien es nulo. Sucede que siempre podemos 
suponer que es nulo, en el sentido de que la cr-álgebra donde está definida una 
medida siempre se puede extender para que incluya a todos los subconjuntos de 
los conjuntos nulos. Antes de probar esto conviene definir una medida completa 
como una medida para la cual todos los subconjuntos de un conjunto nulo son 
medibles (y por lo tanto nulos). 
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Teorema 7.3 Sea X un conjunto fi : A — > [0, +oo] una medida definida sobre 
una a -álgebra de subconjuntos de X. Sea 

3 = {A C X | existen B,C eA tales que B C A C C y ¡i(C \B) = 0}. 

Entonces 23 es una a-álgebra de subconjuntos de X que contiene a A y fi se 
extiende a una única medida en 23, que es completa. 

Demostración: Si A e A es claro que A e 23. Basta tomar B = C = A. 
Así pues A C 23, luego en particular 0, X € 23. 

Si A e 23, sean B, C <E A tales que B C A C C y ¡jl{C \ B) = 0. Entonces 
I\CcI\iCl\B,y claramente V\C,X\,4e.Ay 

// ((X\fi)\(X\C))= M (C\B)=0. 

Por lo tanto X\A £ 23. Para probar que 23 es una c-álgebra basta probar que la 
unión numerable de elementos de 23 está en 23. Sea, pues, {A n }^ =0 una familia 
de elementos de 23. Sean {B n } n y {C n } n según la definición de 23. Entonces 

oo oo oo 

U B n C |J A n c |J C n , 

n—0 n—0 n—0 

los conjuntos de los extremos están en A y 

0 < n ( ( [j C n j \ ( |J B n j j < ¡i t Q C n \ B n j = 0. 

V \n=0 / \n=0 ) ) \n=0 ) 

oo 

Por lo tanto (J A„ € 23. Esto prueba que 23 es una a-álgebra. 

n=0 

Si A € 23 y B, C son los conjuntos dados por la definición, es claro que 
¡J-(B) = f¿(C). Veamos que podemos extender la medida ¡i definiendo ¡jl(A) = 
(i(B) = i-i(C). Es claro que esta es la única extensión posible. En efecto, 
si B' y C también cumplen la definición, entonces B \ B' C C \ B' , luego 
¡jl{B \ B') < n{C \ B') = 0, de donde fi(B \ B') = 0 y n{B) = n(B'), luego B 
y B' dan lugar al mismo valor de n{A). 

Veamos que la extensión de fx que acabamos de definir es realmente una 
medida. Para ello tomamos una familia {A n }^ =0 de elementos de 23 disjuntos 
dos a dos. Sean {B n } y {C„} elementos de A que satisfagan la definición de 23. 

oo oo oo 

Según hemos visto, los conjuntos (J B n y (J C n justifican que (J A n E 23 y 

n—0 n—0 n—0 

es claro que los B n son disjuntos dos a dos, luego 

(oo \ oo oo 

U B n \ =J2^(Bn) = J2^ A n)- 
n=0 / n=0 n=0 

Es claro que la medida en 23 es completa, pues si A G 23 es nulo y D C A, 
entonces tomamos B, C € A tales que B C A C C con n(B) = /ti(C) = 0. 
Claramente 0 C D C C y /z(C \ 0) = 0, luego D e 23. ■ 
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La extensión construida en el teorema anterior se conoce como compleción 
de /i. En vista de esto, normalmente podremos suponer sin pérdida de genera- 
lidad que trabajamos con medidas completas. Otra propiedad importante que 
puede poseer una medida sobre un espacio topológico es la regularidad, que 
definimos a continuación. 

Definición 7.4 Diremos que una medida ¡j, en un espacio topológico X es regu- 
lar si todos los abiertos son medibles, los subespacios compactos tienen medida 
finita y para todo conjunto medible E se cumple 

H{E) = ínf{/i(V) \EdV, V abierto} 

y 

fj,(E) = sup{¿¿(if ) | K C E, K compacto}. 

Diremos que la medida es casi regular si la segunda propiedad se cumple al 
menos cuando ¡jl{E) < +oo y cuando E es abierto. 

En definitiva una medida es regular si la medida de todo conjunto medible 
puede aproximarse por la medida de un abierto mayor y de un compacto menor. 
El concepto de medida casi regular lo introducimos por cuestiones técnicas, pero 
a continuación probamos que en todos los espacios que nos van a interesar es 
equivalente a la regularidad. 

Diremos que un espacio topológico es a- compacto si es unión numerable de 
conjuntos compactos. Por ejemplo, todo abierto en IR™ es a-compacto, pues 
puede expresarse como unión de los compactos 

ü k = {x e Q | ||a;|| < fe, d(x,R n \Q) > 1/fc}, k = 1,2,3,... 

Teorema 7.5 Toda medida casi regular en un un espacio a-compacto es regular. 

Demostración: Supongamos que X es la unión de los compactos {K n }^Li. 
Sustituyendo cada K n por su unión con los precedentes podemos suponer que si 
m < n entonces K m C K n . Dado un conjunto de Borel B tal que n(B) = +oo, 
tenemos que 

oo 

B=\jBDK n , 

n=l 

y como la unión es creciente sup /j,(B O K n ) = fi(B) = +oo. Dado R > 0 existe 

n 

un n tal que ¡i(B n K n ) > R + 1 y, como /i es casi regular, B n K n tiene medida 
finita y existe un compacto K C B n K n tal que fJ.(K) > R, lo que prueba que 
/i es regular. ■ 

Ejercicio: Probar que la compleción de una medida regular es una medida regular. 
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7.2 Funciones medibles 

Si X es un espacio medida, a menudo tendremos que trabajar con subcon- 
juntos de X definidos a partir de una aplicación / : X — > Y y necesitaremos 
garantizar que dichos conjuntos son medibles. Esto lo lograremos mediante el 
concepto de aplicación medible. 

Definición 7.6 Si X es un espacio medida e Y es un espacio topológico, una 
aplicación / : X — > Y es medible si las antiimágenes por / de los abiertos de 
Y son conjuntos medibles. 

Como las antiimágenes conservan las operaciones conjuntistas es muy fácil 
probar que los conjuntos de Y cuyas antiimágenes son medibles forman una 
a-álgebra, que en el caso de una función medible contiene a los abiertos, luego 
contendrá a todos los conjuntos de Borel, es decir, una aplicación es medible si 
y sólo si las antiimágenes de los conjuntos de Borel son conjuntos medibles. El 
siguiente caso particular nos interesará especialmente: 

Teorema 7.7 Una aplicación f : X — > [— oo, +oo] es medible si y sólo si lo 
son todos los conjuntos f^ 1 +oo]] , para todo 

DEMOSTRACIÓN: Ya hemos comentado que los conjuntos con antiimagen 
medible forman una a-álgebra A. Hemos de ver que A contiene a los abiertos 
de [— oo, +oo]. Por hipótesis contiene a los intervalos ]x, -t-oo], luego también a 
sus complementarios [— oo, x]. Todo intervalo [— oo, x[ es intersección numerable 
de los intervalos [— 00,2; + 1/n], luego también está en A. De aquí se sigue que 
A contiene también a los intervalos ]x, y[ = ]x, +00] n [—00, y[. Finalmente, todo 
abierto de [—00, +00] se expresa como unión numerable de intervalos abiertos, 
luego está en A. m 

Es claro que la composición de una función medible con una función continua 
es una función medible. Esto nos da, por ejemplo, que si / : X — > [—00, +00] 
es medible, también lo es |/| ya/ para todo número real a, así como 1// si / 
no se anula. 

Para probar resultados análogos cuando intervienen dos funciones (suma de 
funciones medibles, etc.) usaremos la observación siguiente: 

Si los espacios topológicos Y, Z tienen bases numerables ( como 
[—00, +00] y sus subespacios) y u : X — > Y, v : X — > Z son 
aplicaciones medibles, entonces la aplicación u x v : X — > Y x Z 
dada por (u x v)(x) = (u(x),v(x)) es medible. 

Basta observar que los productos de abiertos básicos Ax B forman una base 
numerable deYxZ, luego todo abierto de Y x Z es unión numerable de estos 
conjuntos, por lo que es suficiente que sus antiimágenes sean medibles, pero 
(uxvy^Ax B]=u- 1 [B]nv- 1 [C]. 

Ahora, por ejemplo, si u, v : X — > IR son aplicaciones medibles, también lo 
son / + g y fg, pues son la composición de uxv con la suma y el producto, que 
son continuas. 
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Nos interesa extender este resultado a funciones u,v : X — > [—00, +00], 
pero entonces tenemos el problema de que no es posible extender la suma y el 
producto de modo que sean continuas en los puntos (+00, —00), (—00, +00) en 
el caso de la suma y en los puntos (±00, 0), (0, ico) en el caso del producto. 

Hacemos esto: definimos u + v de modo que +00 — 00 = 0 (por ejemplo) y 
ahora observamos lo siguiente: 

Sea u : X — > Y una función medible, A un subconjunto medible de 
X e y e Y. Entonces la función v : X — > Y que coincide con u 
fuera de A y toma el valor y en A es medible. 

La razón es que 



v~ 1 [B] = 




Así, dadas u,v : X — > [—00, +00] medibles tales que donde una vale +00 
la otra no vale —00, las modificamos para que valgan 0 donde toman valores 
infinitos, las sumamos y obtenemos una función medible, luego modificamos 
la suma para que tome el valor 00 adecuado donde deba tomar dichos valores 
(claramente en un conjunto medible), con lo que obtenemos una función medible. 
Igualmente con el producto. 

Otra consecuencia del teorema sobre el producto cartesiano de funciones 
medibles es que si tenemos dos funciones medibles u, v : X — > [—00, +00], los 
conjuntos del estilo de {x € X \ u{x) < v(x)} son medibles (por ejemplo en este 
caso se trata de la antiimagen por u x v del abierto y) \ x < y}). 

Dos operaciones definibles sobre todas las funciones f,g:X — > [—00, +00] 
son las dadas por (fVg)(x) = máx{f(x),g(x)\ y (/A g) (x) = mín{f(x),g(x)}. 

Las funciones V, A : [—00, +00] x [—00, +00] — > [—00, +00] son ambas con- 
tinuas, pues lo son trivialmente cuando se restringen a los cerrados determina- 
dos por las condiciones x < y e y < x, respectivamente. Esto implica que si 
f,g:X — > [—00, +00] son medibles, también lo son / V g y / A g. 

En particular si / : X — > [—00, +00] es una función medible, definimos las 
funciones /+ = / V 0 y /~ = — (/ A 0), llamadas parte positiva y parte negativa 
de /, respectivamente. 

Tenemos que si / es medible también lo son /+ y /~. El recíproco es cierto 
porque claramente / = /+ — /~ . Además |/| = / + + /~. 

Seguidamente probaremos que la medibilidad se conserva al tomar límites. Si 
{ a n}^Lo es una sucesión en [—00, +00], definimos sus límites superior e inferior 
como 

líma n = ínf supa„, líma„ — sup ínf a n . 

n k>0n>k n k>0n>k 

En el capítulo III demostrábamos que el límite superior de una sucesión es el 
supremo de sus puntos adherentes. Igualmente se prueba que el límite inferior 
es el ínfimo de sus puntos adherentes. 
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Una sucesión converge si y sólo si tiene un único punto adherente (su límite), 
por lo que {a n }^ =0 converge si y sólo si líma„ = Km g n y entonces 

n n 

Km a n = Km a n = Km a n . 

n n n 

Si {fn}^Lo es una sucesión de funciones /„ : X — > [—00, +00], definimos 
puntualmente las funciones sup/„, ínf/„, Km /„, y lím/„. Si la sucesión es 

n n n n 

puntualmente convergente las dos últimas funciones coinciden con la función 
límite puntual lím/„. 

n 

Teorema 7.8 Si las funciones f n son medibles, también lo son las funciones 
sup /„, ínf f n , Km /„ y lím /„. 

n n n n 

Demostración: Claramente 

sup /„ ) []x, +00]] = I) f- 1 []x, +00]] , 
' ^ / „=o 

es medible. Igualmente se prueba con ínfimos y de aquí se deducen los resultados 
sobre límites superiores e inferiores. En particular, el límite puntual de una 
sucesión de funciones medibles es una función medible. ■ 

Si X es un espacio medida y E es un subconjunto medible, entonces los 
subconjuntos medibles de E forman una a-álgebra de subconjuntos de E y la 
medida de X restringida a esta cr-álgebra es una medida en E. En lo sucesivo 
consideraremos a todos los subconjuntos medibles de los espacios medida como 
espacios medida de esta manera. 

00 

Notar que si X = (J E n es una descomposición de X en subconjuntos 

n=0 

medibles (no necesariamente disjuntos), entonces / : X — > Y es medible si y 
sólo si lo son todas las funciones /|s n , pues si / es medible y G es un abierto 
en Y, (/k)" 1 ^] = f-^G] n E n , luego (/UJ" 1 ^] es medible, y si las f\ En 
son medibles, entonces / _1 [G] = (/|e„) _1 [G], luego también es medible. 

Si E es un subconjunto de X, su función característica xe es medible si y 
sólo si lo es i?. 

Si extendemos una función medible / : E — > [—00, +00] asignándole el va- 
lor 0 fuera de E, obtenemos una función medible en X. Por ello identificaremos 
las funciones medibles / : E — > [—00, +00] con las funciones medibles en X 
que se anulan fuera de E. En particular identificaremos la restricción a i? de 
una función / : X — > [—00, +00] con la función fxE- 

Los resultados que hemos dado son suficientes para garantizar que todas las 
funciones que manejaremos y los conjuntos definidos por ellas son medibles. No 
insistiremos en ello a menos que haya alguna dificultad inusual. 



7.3. La integral de Lehesgue 



261 



7.3 La integral de Lebesgue 

En todo espacio medida X podemos definir una integral que generaliza fuer- 
temente a la integral de Riemann que estudiamos en el capítulo anterior para 
el caso de la recta real. Más adelante veremos que es posible definir una única 
medida en R de modo que b]) = b — a. La integral asociada a esta medida 
coincide con la integral de Riemann sobre las funciones en las que ésta está 
definida. 

La idea fundamental es que el papel que juegan los intervalos en la integral 
de Riemann lo juegan los conjuntos medibles en el caso general. Al considerar 
conjuntos más generales obtenemos muchas más funciones integrables, lo que 
se traduce en que la integrabilidad se conserva no sólo por las operaciones al- 
gebraicas (como en el caso de la integral de Riemann) sino también por pasos 
al límite. En lugar de dar una definición de integral que muestre estas ideas, 
aprovecharemos las propiedades de convergencia para dar una definición rápida. 

Definición 7.9 Una función simple en un espacio medida X es una función 
medible s : X — > [0, +oo[ que sólo toma un número finito de valores ai, ... , a n . 
Si llamamos Ai = s _1 [a¿], entonces los conjuntos Ai son medibles disjuntos y 

n 

S = E "*XA, ■ 

1=1 

La base de nuestra construcción de la integral será el teorema siguiente: 

Teorema 7.10 Si X es un espacio medida y f : X — > [0, +oo] es una función 
medible, entonces existe una sucesión {s n }^ = i de funciones simples en X tal 
que 

0 < si < s 2 < • • • < / y / = lím s„. 



Demostración: Para cada número na- 
tural n > 0 y cada í € 1 existe un único 
k = k n (t) e N tal que k/2 n < t < (k + 1) /2". 
Sea /„ : [0, +oo] — > [0, +oo] dada por 



fn(t) 



{k n 
n 



(t)/2" 



si 0 < t < n 
si n < t < +oo 



2-- 



1-- 



La figura muestra la función / 2 . Claramente 
/„ toma un número finito de valores y 

h < h < h < ■ ■ ■ < i, 1 2 

donde / es la función identidad 7(í) = t. Como t — 1/2™ < f n (t) < t para 
0 < t < n, es claro que {f n }^Li converge puntualmente a I. 

Sea s„ = fof n . Claramente s„ toma un número finito de valores (a lo sumo 
los que toma /„) y las antiimágenes de estos valores son las antiimágenes por / 
de los intervalos donde los toma /„, luego son conjuntos medibles. Además 



0 < si < s 2 < • • • < /, 
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luego las funciones s n son simples y, tomando límites, es obvio que la sucesión 
converge puntualmente a /. ■ 

n 

Definición 7.11 Sea X un espacio medida y s = Y a iXAi una función simple 

»=i 

en X. Definimos la integral de s en X como 



n 

/ s d/j, = ain(Aj) g [0, +oo] , 



»=i 

con el convenio de que +oo • 0 = 0. 

n 

Si E es un subconjunto medible de X, entonces s\e = Y a iXAinE, donde 

i=i 

las funciones características se toman ahora sobre E. Por lo tanto 



r. n 

/ s\ E dfi = t í (A l n £"). 
Je „•_•, 



Por otro lado s\e = Y a íXAinE (con las funciones características en X), luego 

i=i 

concluimos que 

/ sdfi= / 5Xa = / ] Q ¿ ^1 ¿7), 
Je Jx j=1 

es decir, que a efectos de integración podemos adoptar consistentemente el con- 
venio explicado antes por el que identificamos la función s\e con s\e- 

Ahora necesitamos el siguiente resultado técnico, que después generalizare- 
mos notablemente. 

Teorema 7.12 Sea X un espacio medida. 

a) Sea s una función simple en X. Para cada subconjunto medible E de X 
definimos v{E) = J E sdfi. Entonces v es una medida en X. 

b) Si s y t son funciones simples en X se cumple 

¡ (s + t) dfi = sdfj,+ t df¿. 
Jx Jx Jx 

n 

Demostración: a) Sea s = Y «¿xa,- Claramente is(0) = 0. Sea E = 

¿=i 

oo 

(J Ej una unión disjunta de conjuntos medibles. Entonces 

3 = 1 

n n oo 

v{E) = ^ j a i ^{A i C\E) = ^2a i ^ii{A l r\E j ) 

Í—1 Í—1 j — 1 



oo n 



j=i ¿=i j=i 
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b) Sean s = ^2 a iXAi y t = PjXBj ■ Llamemos E^ = A.¿ n Bj. Así, tanto 

i=i j=i 

s como í son constantes en los conjuntos E ¿ j (s toma el valor a¿ y í el valor /Jj). 
Por lo tanto 

/ (s + í) d/i = («j + fl^^Eij) = aifj,(Eij) + 0jfJ,(Eij) = sdLi + tdfi. 

J Eij J Eij J Eij 

Como los conjuntos E¿j son disjuntos dos a dos y su unión es X, la parte a) 
nos da que la igualdad se cumple para integrales en X. a 

En particular notamos que si s < t son funciones simples en un espacio 
medida X, entonces t — s también es una función simple y 

/ sdfi < sd/j,+ (t — s)dfi= t d¡Á. 
Jx Jx Jx Jx 

En particular se cumple que 

/ td¡j, = sup{ / sd[i | s es una función simple, s < ¿}. 
Jx Jx 

Esto hace consistente la siguiente definición: 

Definición 7.13 Sea X un espacio medida y / : X — > [0, +oo] una función 
medible. Definimos la integral de / como 

/ fdfj, = sup{ / sdri | s es una función simple, s < /} € [0, +oo]. 
Jx Jx 

Observar que si E es un subconjunto medible de X, si s es una función 
simple en E por debajo de J\e, su extensión a X (nula fuera de E) es una 
función simple bajo Jxe, y la restricción a E de una función simple en X bajo 
/%B es una función simple en E bajo /|#. De aquí se sigue que 



íe Jx 



ÍXe d[i, 



pues ambas integrales son el supremo del mismo conjunto de números reales. 
Las propiedades siguientes son inmediatas a partir de la definición: 

Teorema 7.14 Sea X un espacio medida y E un subconjunto medible de X. 

a) Si 0 < / < g son funciones medibles en X, entonces J x f dfj, < J x gd[i. 

b) Si f > 0 es una función medible en X y A C B son subconjuntos medibles 
de X, entonces J A fdri< f B f dri. 

c ) Si f > 0 es una función medible en X y f\s = 0, entonces f E fdfj, = 0 
(aunque sea n(E) = +oo). 
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d) Si f > O es una función medible en X y n(E) = O, entonces J E / d[i = O 
(aunque sea /\e = +00 ). 

El resultado siguiente es uno de los más importantes del cálculo integral: 

Teorema 7.15 (de la convergencia monótona de Lebesgue) Sea X un 

espacio medida y {f n }^ = i una sucesión de funciones medibles en X tal que 

0</i</ 2 <•••</ y / = Hm/„. 

n 

Entonces f es medible y 

/ fdfi = lím / /„ d/j,. 
Jx n Jx 

Demostración: Por el teorema anterior f x f n d^i < J x f n+ idfi. Toda 
sucesión monótona creciente en [0, +00] converge a su supremo, luego existe 
a = lím J x f n dfi € [0, +00]. 

Sabemos que / es medible por ser límite puntual de funciones medibles. De 
nuevo por el teorema anterior J x f n d¡jL < f x f d/i, luego a < J x f dfi. 
Sea s una función simple s < f y sea 0 < c < 1. Definimos 

E n = {x e X | f n (x) > cs(x)}, para n = 1,2,3, .. . 

Claramente E\ C E<¿ C E3 C • • • , son conjuntos medibles y, según veremos 
enseguida, X = [j E n . 

n 

En efecto, si x G X y f(x) = 0, entonces x € E\ y si, por el contrario, 
f(x) > 0 entonces cs(x) < s(x) < f(x), luego x € E n para algún n. Claramente 



f n d/J-> f n d/j,>c sd^i. 

JX JE n JE„ 



Ahora aplicamos el teorema 7.12 y el hecho de que la medida de la unión 
de una sucesión creciente de conjuntos es el supremo de las medidas, con lo que 
obtenemos 

a = lím / f n dfi> clím / s d¡i = c / s dfj,. 
n Jx n Je„ Jx 

Como esto es cierto para todo c < 1 podemos concluir que a > J x sdfi para 
toda función simple s < /, luego tomando el supremo de estas integrales resulta 
a > J x f d[i, con lo que tenemos la igualdad buscada. ■ 

El teorema de la convergencia monótona permite en particular reducir pro- 
piedades de la integral de funciones no negativas a propiedades de funciones 
simples, como ilustra el teorema siguiente, que muestra que la integral conserva 
las sumas, incluso las infinitas. 
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Teorema 7.16 Sea X un espacio medida y sea {fn}^i una sucesión de fun- 
ciones no negativas medibles en X. Entonces 



p OO OO p 

/ f n d ^ = / f n d ^ 



DEMOSTRACIÓN: Probaremos en primer lugar que si / y g son medibles y 
no negativas, entonces 



/ (f + 9)dfJ,= / fd^+ gd^. 
Jx Jx ■) X 



Tomamos dos sucesiones monótonas {s n }%Li y {t n }^Li de funciones simples 
convergentes a / y g respectivamente (existen por el teorema 7.10). 

Por el teorema 7.12 sabemos que J x (s n + t n ) d\i = f x s n dfx + f x t n dfx y, 
tomando límites, el teorema de la convergencia monótona nos da la igualdad 
buscada. En el caso general sabemos, por lo que acabamos de probar, que 

\ Y^ nd ^ = Y f nd V para fe =1,2,3,... 

■' X n=l n=l-' X 
k 

Las funciones fn forman una sucesión monótona de funciones medibles, 

n=l 

luego por el teorema de la convergencia monótona 

p OO OO p 

/ J2^ nd ^^H ? n d ^- 

Jx n=l n=l'' X 



Generalizamos ahora la primera parte del teorema 7.12. 

Teorema 7.17 Sea X un espacio medida y f : X — > [0, +co] una función 
medible. Para cada subconjunto medible E de X definimos v(E) — f E fd[i. 
Entonces v es una medida en X. 

oo 

Demostración: Claramente v(jZ) = 0. Sea E = (J E n una unión disjunta 

oo 

de conjuntos medibles. Es claro que f\E = ÍXe„- Aplicando el teorema 

n=l 

oo 

anterior queda v(E) = v {E n )- ■ 

n=l 

Después necesitaremos el hecho siguiente: 

Teorema 7.18 (Lema de Fatou) Sea X un espacio medida y sea {f n }^Li 
una sucesión de funciones medibles no negativas en X. Entonces 



/ lím f n dji < Km / /„ dri. 

JX n n Jx 
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Demostración: Sea g k = ínf /„. Entonces g k < f n para n > k, luego 

n>k 

Jx 9k dfj < ínf J x f n dfj. Además las funciones g k forman una sucesión monó- 
tona creciente que converge a lím /„,, luego por el teorema de la convergencia 

n 

monótona 

/ lím f n dfj = lím / g k dfi = sup / g k dfj, < sup ínf / f n dfj = lím / f n dfj. 

n fe Jj k>lJx k>ln>kJx n JX 



Ahora extendemos la integral a funciones medibles no necesariamente ma- 
yores o iguales que 0. 

Definición 7.19 Sea X un espacio medida y / : X — > [— oo, +oo] una función 
medible. Entonces /+ y /~ son funciones medibles no negativas y / = / + — /~ . 
Diremos que / es integrable Lebesgue en X si tanto j x f + d[¿ como j x f~ dfi 
son finitas. En tal caso definimos la integral de Lebesgue de / como 



í fdn= í f + dv- f f-dfxe 
Jx Jx Jx 



Llamaremos L 1 (/i) al conjunto de las funciones integrables Lebesgue en X 
respecto a la medida ¿¿. 

Si una función / es no negativa, entonces / _ = 0 y su integral es la que ya 
teníamos definida. Las propiedades siguientes son todas inmediatas a partir de 
los resultados que ya hemos demostrado. 

Teorema 7.20 Sea X un espacio medida y sean f,g:X — > [— oo,+oo] fun- 
ciones medibles. 

a) f es integrable si y sólo si J x \f \ d¡i < +oo, y en tal caso 

< í \f\di*. 
Jx 

b) Si a, ¡3 € K, y f , g son integrables, entonces af + ¡3g es integrable y 



fd\i 
x 



x 



af + 0g) dn = a f dfj, + /3 g d¡i. 

Jx Jx 



c ) Si f < g y ambas son integrables, entonces j x f dfj < j x gdfj. 

d) Si E es un subconjunto medible de X y f es integrable en X, entonces f 
es integrable en E y J E f dfi = J x f\E dfj. 

e) Si E y F son subconjuntos medibles disjuntos de X, entonces la función 
f es integrable en E U F si y sólo si lo es en E y en F y, en tal caso, 



/ fdfj= / fdfi+ / fdfi. 
Jeuf Je Jf 
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f) Si E es un subconjunto medible de X y f\ E = O, entonces J E f dfi = 0. 

g) Si E es un subconjunto nulo de X, entonces J E fdfi = 0. 

h) Si f es integrable en X, entonces el conjunto de los puntos donde f toma 
los valores ±oo es nulo. 

(La propiedad e sale de aplicar el teorema 7.17 a las partes positiva y negativa 
de/.) 

Algunas consecuencias: por d) vemos que J E 1 d/j, = J x \e dri = fi{E). Por 
a) tenemos que si |/| < g y g es integrable entonces / también lo es. Toda 
función medible y acotada sobre un conjunto de medida finita es integrable. 

Otra observación de interés es la siguiente: si pasamos de una medida a su 
compleción, es claro que las funciones simples para la primera lo son también 
para la segunda y las integrales coinciden. El teorema de la convergencia monó- 
tona implica entonces que toda función positiva integrable para una medida 
sigue siéndolo para su compleción, y de aquí se sigue inmediatamente el resultado 
para funciones arbitrarias. De este modo la integral respecto a la compleción 
extiende a la integral respecto a la medida de partida. 

Veamos ahora un teorema de convergencia válido para funciones medibles 
arbitrarias. 

Teorema 7.21 (de la convergencia dominada de Lebesgue) Sea X un 

espacio medida y sean {,f n }'^Li funciones medibles de X en [—00, +oo] que 
convergen puntualmente a una función f. Si existe una función integrable 
g : X — > [— oo,+oo] tal que |/„| < g para todo n, entonces f es integrable 

y 



fdfi = lím / /„ dfi. 
x 71 Jx 

Se dice que las funciones /„ están dominadas por g. 

DEMOSTRACIÓN: Claramente |/| < g, luego / es integrable. Puesto que 
\fn — f\ < 2g, podemos aplicar el lema de Fatou a las funciones no negativas 
2^ — \ fn — f\, con lo que obtenemos que 

/ 2 5 d M <lím / (2g-\f n -f\)d t i= í 2.gd M + lím / (-\f n - f\) dfi. 

JX n Jx Jx n Jx 

Es fácil ver que el signo negativo sale del límite, pero cambiando éste por un 
límite superior, así — lím J x \f n — f\ dfi > 0, o sea, lím J x \ f n — f\ d\i < 0. 

Pero es obvio que 0 < lím J x \f n — f\dfi < lím J x |/„ — f \ d\i = 0, luego 

n n 

los límites superior e inferior coinciden, luego lím f x |/„ — /I d/j, = 0. Ahora 

n 

aplicamos que 

/ f n d[i- fdfj, = / (f n -f)dfj, < / \f n -f\du., 
Jx Jx Jx Jx 

de donde se sigue el teorema. ■ 
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Cuando una propiedad se verifica para todos los puntos de un espacio medida 
salvo los de un conjunto nulo se dice que la propiedad se verifica para casi todo 
punto, y lo abreviaremos p.c.t.p. Veamos un ejemplo: 

Teorema 7.22 Si X es un espacio medida y f : X — > [0, +oo] es una función 
medible tal que J x f d/j, = 0, entonces / = 0 p.c.t.p. de X. 

Demostración: Para cada natural n > 0 sea E n = {x e E \ f(x) > l/n}. 
Entonces 

< I f*l*< [ fdn = 0, 
n J En Jx 

luego /J,(E n ) = 0. La unión de los E n es el conjunto E = {x € X \ f(x) > 0}, 
luego / = 0 salvo en los puntos del conjunto nulo E. ■ 

Cuando digamos que una función / : X — > [— oo, +oo] está definida p.c.t.p. 
esto significará que en realidad es / : X \ E — > [— oo, +oo], donde E es un 
conjunto nulo. Diremos que / es medible si lo es al extenderla a X tomando el 
valor 0 en E. En tal caso podemos hablar de J x f d\x definida como la integral 
de dicha extensión. 

Terminamos la sección con un importante teorema sobre integrales paramé- 
tricas: 

Teorema 7.23 Sea U abierto en W 1 , K un espacio métrico compacto, fj, una 
medida de Borel finita en K, sean f : U x K — > R una función continua y 
g : K — > R una función medible acotada. Definamos F : U — > R™ como la 
función dada por 

F ( x ) = / f{x,y)g{y)d^{y), 

JK 

donde dfi(y) indica que la integral se realiza respecto a la variable y € K , con- 
siderando constante a x. Entonces F es continua en U y si existe 

df 

:UxK — > R 

oxí 

y es continua en U x K , entonces existe 

dF f df 



7 f • ■ 
dXi = J K dx^ V)9{y)Mv) 



y es continua en U. 



DEMOSTRACIÓN: Tomemos xq e U y sea B una bola cerrada de centro 
x 0 contenida en U. Sea M una cota de g en K. Como / es uniformemente 
continua en B x K, dado e > 0 existe un 6 > 0 tal que si ||a; — a?o || < <5, 
entonces \ f(x,y) — f(x 0 ,y)\ < e/Mfi(K), para todo y € K. Por consiguiente, si 
1 1 re — a¡o|| < 5 se cumple 

\F(x) - F(x 0 )\ < f \f(x,y)-f(x 0 ,v)\\g(y)\dn(y)<e. 
Jk 

Esto prueba que F es continua en xq. 
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Supongamos ahora la hipótesis de derivabilidad respecto a i, y sea e¿ el 
¿-ésimo vector de la base canónica de IR™. Como df/dxi es uniformemente 
continua en B x K, existe un S > 0 tal que si \h\ < S entonces 



dxi 



Oo + he u y) 



dxi 



< M^KY parat ° d0!/eK 



Si \h\ < 6 e y £ K, el teorema del valor medio nos da que existe un r € 
tal que \r\ < \h\ y 

df 

f(x 0 + ke u y) - f(x 0 , y) = g^-(xo + re l ,y)h. 

(Notar que r depende de y.) Por consiguiente, 

f(x 0 + heí,y)g(y)- f(x 0 ,y)g(y) df 



h 



dxi 



{xo,y)g(y) 



dx. 



df 



Oo + reuy) - g^,( x o,y) 



\g(y)\< 



De aquí se sigue claramente que 
F(x a + he,) - F(x 0 ) 
h 

siempre que \h\ < S, luego existe 



-L 



dx. 



(x 0 ,y)g(y)d^(y) 



< e. 



dF 



(xo) 



Km , 

OXi h^Q h J K OXi 

Además la derivada es continua por la primera parte de este mismo teorema. 



F(x 0 + he,) - F(x Q ) 



df 



(xo,y)g(y) dn(y). 



7.4 El teorema de Riesz 

Hasta aKora no tenemos ninguna medida de interés a la que aplicar los re- 
sultados que acabamos de exponer. La construcción de medidas es el punto más 
delicado de toda la teoría. Puesto que el proceso es complicado cualquiera que 
sea el camino que tomemos, seguiremos uno que nos proporcionará un teorema 
notable de la teoría de la medida, el teorema de representación de Riesz. Nece- 
sitamos unos preliminares topológicos sobre espacios localmente compactos. 

Definición 7.24 Un espacio (de Hausdorff) X es localmente compacto si todo 
punto de X tiene una base de entornos compactos. 

Así pues, si p es un punto de un espacio localmente compacto X y V es un 
entorno abierto de p, existe un entorno compacto K C V. Por definición de 
entorno existe un abierto W tal que p£WcKcVy claramente W C K es 
un entorno compacto de p. En resumen, si X es localmente compacto, p € X y 
V es un abierto tal que p € V, existe otro abierto W con clausura compacta tal 
que p e W C W C V. 

El teorema siguiente recoge un par de propiedades sencillas: 
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Teorema 7.25 Sea X un espacio de Hausdorff. 

a) Si K C X es compacto y p € X \ K , entonces existen abiertos disjuntos 
U y V tales que p eU y K CV. 

b) Si X es ¡ocalmente compacto, V es abierto en X y K C V es compacto, 
entonces existe un abierto W tal que KcWcWcVyWes compacto. 

Demostración: a) Por la propiedad de Hausdorff, para cada x € K pode- 
mos encontrar abiertos disjuntos U x y V x tales que p € U x y x € V x . Entonces 
K está cubierto por los V x , luego podemos tomar un subcubrimiento finito 
V Xl , . . . , V Xn . Basta tomar como U la intersección de los U Xi y como V la unión 
de los V Xi . 

b) Para cada x € K existe un abierto W x de clausura compacta tal que 
x € W x C W x C V. Los abiertos W x cubren a K. Tomamos un subcubrimiento 
finito y llamamos W a la unión de sus miembros. ■ 

Si X es un espacio localmente compacto y / : X — > R, llamaremos soporte 
de / a la clausura del conjunto de puntos donde / toma valores ^ 0. Llamare- 
mos C C (X) al conjunto de las aplicaciones continuas / : X — > R con soporte 
compacto. Es claro que se trata de un subespacio vectorial de C(X). 

Usaremos las notaciones K -< f y / ~< V para indicar que / : X — > [0, 1], 
/ G C C (X), K es compacto, V es abierto, / toma el valor 1 en K y / toma el 
valor 0 en X \ V . 

Teorema 7.26 (Lema de Urysohn) Sea X un espacio localmente compacto, 
sea V un abierto y K C V compacto. Entonces existe f G C C (X) tal que 

DEMOSTRACIÓN: Por el teorema anterior existe un abierto Wq de clausura 
compacta tal que K c Wq C Wq C V. Sea W\ = X. Aplicamos de nuevo el 
teorema a Wq C V, con lo que obtenemos un abierto W\/2 de clausura compacta 
tal que 

K C Wq C Wq C W 1/2 C W 1/2 C V C W x . 

Dos nuevas aplicaciones del mismo teorema nos dan 
K CWqCWqC Wi/4 C W 1/4 C W 1/2 c W 1/2 c W 3/4 C W 3/i CVcWl 

Inductivamente vamos obteniendo una familia de abiertos {Wr} r ^n, donde 
R = {k/2 l | i € N, 0 < k < 2 1 }, de manera que si r < r' < 1 son puntos de R, 
entonces K C W r C Vt-V C V. 

Definimos g : X — > [0, 1] mediante y(x) = ínf{r £ E | i 6 W,.}. Así 
= {0} porque K C Wq y ,g[X \ V] = {1} porque í/ r n (X \ V) = 0 si r < 1. 
Basta probar que g es continua, pues entonces / = 1 — g cumple lo pedido. 

Sea x € X y e > 0. Si g(x) ^ 0 y ^¿ 1, entonces existen r,r' £ R tales 
que g(a;) — e < r < g(x) < r' < g(x) + e, luego U = W r > — W r es un entorno de 
x que cumple 

g[U] C [r,r'} C ]g(x) - e, g(x) + e[. 
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Si g(x) = O tomamos 0 = g(x) < r < g(x) + e yU= W r cumple lo mismo. Si 
g(x) = 1 tomamos g(x) — e < r < g(x) y el U buscado es X \ W r . En cualquier 



Teorema 7.27 Si X es un espacio ¡ocalmente compacto, V\, . . . ,V n son abier- 
tos de X y K C V\ U • • • U V n es compacto, entonces existen funciones hi -< V¿ 
tales que h\(x) + ■ ■ ■ + h n (x) = 1 para todo x € K. 

Se dice que las funciones /i¿ forman una partición de la unidad subordinada 
a los abiertos dados. 

Demostración: Dado x € K existe un i tal que x G V¿. Existe un abierto 
W x de clausura compacta tal que x £ W x C W x C V¿. Los abiertos W x cubren 
a K. Extraemos un subcubrimiento finito y llamamos Hi a la unión de todos 
los abiertos del subcubrimiento cuya clausura está en V¿. De este modo los íf¿ 
son abiertos de clausura compacta que cubren a K y Hi C V¿. Por el teorema 
anterior existen funciones ií¿ -< <?¿ -< V¿. Definimos 

hi=gi, h 2 = (l-gi)g 2 , ■■■ K = (1 - #i)(l - g 2 ) ■ ■ ■ (1 - g„-i)g„. 

Es claro que /i¿ ~< V¿ y una simple inducción prueba que 

hi + ■ ■ ■ + h n = 1 - (1 - gi ) ■ ■ ■ (1 - g n ). 

Es claro entonces que la suma vale 1 sobre los puntos de K, pues una de las 
funciones <?¿ ha de tomar el valor 1. ■ 

Ya estamos en condiciones de demostrar el teorema de Riesz. 

Teorema 7.28 (Teorema de representación de Riesz) Sea X un espacio 
localmente compacto y sea T : C C (X) — > IR una aplicación lineal tal que si 
f > 0 entonces T(f) > 0. Entonces existe una única medida de Borel casi 
regular ¡i en X tal que para toda función f £ C C (X) se cumple 



DEMOSTRACIÓN: Veamos primero la unicidad. Es claro que una medida 
casi regular está completamente determinada por los valores que toma sobre los 
conjuntos compactos, luego basta probar que si ¡jl\ y [i 2 representan a T en el 
sentido del teorema entonces ^i(K) = 1¿ 2 {K) para todo compacto K. 

Por la regularidad existe un abierto V tal que K C V y fJ, 2 (V) < fJb 2 {K) + e. 
Por el lema de Urysohn existe una función K -< f -< V . Entonces 



caso obtenemos la continuidad de g en x. 
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Por consiguiente Hi(K) < \i 2 {K) e igualmente se prueba la desigualdad 
contraria. 

Para cada abierto V de X definimos [¿(V) = sup{T(/) | / -< V}. Es obvio 
que si V\ C V 2 entonces //(V) < //(V2), luego si definimos 

¡i{E) = ínf{//(V) I E C V, V abierto}, para todo E C X, 

es claro que la medida de un abierto es la misma en los dos sentidos en que la 
tenemos definida. 

Aunque hemos definido la medida de cualquier conjunto, ésta sólo cumplirá 
las propiedades de las medidas al restringirla a una cierta cr-álgebra que contiene 
a la cr-álgebra de Borel. Concretamente, definimos Mf como la familia de 
subconjuntos E de X tales que ¡x(E) < +00 y 



Definimos M como la familia de todos los E C X tales que E fl K € M_f 
para todo compacto K. Probaremos que M es una a-álgebra que contiene a la 
cr-álgebra de Borel y que la restricción de fi a M es una medida casi regular. 
Veremos también que Mf está formada por los conjuntos de M de medida finita. 
Dividimos la prueba en varios pasos. 

1) Si {E i }^L 1 son subconjuntos de X, entonces 



Probamos primero que si Vi y V¿ son abiertos //(Vi U V¿) < //(V) +/z(V2). 
Tomemos g -< Vi U V2 arbitraria. Por el teorema 7.27 existen funciones hi 
y h 2 tales que /i¿ < V y hi + h 2 vale 1 sobre los puntos del soporte de g. 
Por lo tanto Yug ~< V¿, g = hig + h 2 g- 



Como esto se cumple para toda g -< V + V 2 , concluimos la desigualdad 
buscada. 

Podemos suponer que //(¿7¿) < +00 para todo i, o la desigualdad que 
queremos probar se cumpliría trivialmente. Dado e > 0 la definición 
de // implica que existen abiertos V¿ que contienen a Ei de modo que 
//(V) < tí(Ei) + e/2 1 . Sea V la unión de todos los V y tomemos / -< V. 
Como / tiene soporte compacto en realidad / -< Vi U • • • U V n para algún 
n, luego 



//(£") = sup{//(iT) | K c E, K compacto}. 




T(g) = T(hig) + T(h 2 g) < //(V) + //(V 2 ). 



OO 

T(f) < m(V U • • • U V n ) < //(Vi) + • • • + //(V„) < Y, ÁEi) + e. 

i=l 
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Como esto vale para toda / -< V, resulta que 

oo 

»(V)<J2KEi)+e. 
»=i 

Ahora bien, la unión de los Ei está contenida en V, y la función ¡i es 
claramente monótona por su definición, luego 

(oo \ oo 
\JeA <¿ +e. 
i=l / ¿=1 

Como esto vale para todo e tenemos la desigualdad buscada. 

2) Si K es compacto, entonces K € M F y 1¿{K) = íní{T(f) \ K -< /}. £n 
particular los compactos tienen medida finita. 

Si -< / y 0 < a < 1, sea V a = {x e X \ f(x) > a}. Entonces K C V a y 
si g <V a se cumple ag < /. Por lo tanto 

M^O < M^a) = sup{T( 3 ) | g -< 14} < a^Tif). 

Si hacemos que a tienda a 1 concluimos que < T(/) y es obvio que 

K está en Mj?. 

Dado e > 0 existe un abierto V tal que K CV y m(^) < M-^Ü + e - Existe 
una función K < f <V, luego 

< T(/) < »(V) < (i(K) + e, 

lo que prueba que n(K) = ínf{T(/) | -< /}. 

3) Mf contiene a todos los abiertos de medida finita. 

Sea V un abierto de medida finita y a un número real tal que a < n(V). 
Existe / -< V tal que a < T(f). Entonces T(f) < fi(K), pues en caso 
contrario existiría un abierto W tal que K C W y /¿(-Fí) < /¿(W) < T(f), 
pero / -< W, luego T(/) < /x(W), contradicción. Así hemos encontrado 
un compacto K C V tal que a < f¿(K), lo que prueba que V G Mp- 

oo 

4) Si son elementos disjuntos de Mj?, y E = [j Ei entonces 

i=l 

oo 

/i(f?) = ¿M^i)- 

i=l 

5i además ¡jl{E) < +oo entonces E € Mp. 

Veamos primero que si -fíi y .K2 son compactos disjuntos U -K2) = 

¡j,(Ki) + fj,(K 2 ) ■ Dado e > 0 existe Ki -< f -< X\K 2 . Por el paso 2) existe 
,g tal que ífi U K 2 -< g y T(#) < n(Ki U K 2 ) + e. Claramente K\ -< fg y 
ÜT 2 -< (1 - /)<?, luego 

/i(ÍTi) + n{K 2 ) < T(fg) + T(g - fg) = T(g) < p{K x U K 2 ) + e, 
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luego tenemos fi{Ki) + fJ,(K 2 ) < (¿(Ki U K 2 ) y el paso 1) nos da la otra 
desigualdad. 

Pasando al caso general, de nuevo por 1) basta probar una desigualdad. 
Esta es trivial si ¡jl{E) = +oo, luego podemos suponer que E tiene medida 
finita. Fijado e > 0, puesto que Ei £ Mf existen compactos ií¿ C Ei tales 
que n(Hi) > n(Ei) - e/2*. Sea K n = H x U • ■ • U H n . Entonces 

n n 

li{E) > ii{K n ) = YsVÍHí) > Ys^Ei) - e, 

i=l i=\ 

lo cual nos da claramente la desigualdad buscada. La desigualdad anterior 
muestra también que n(K n ) tiende a n(E) cuando n tiende a oo (una vez 
sabemos que la serie suma n(E)), lo que implica que E £ M¡?. 

5) Si E £ Mf y e > 0, existen un compacto K y un abierto V tales que 
K C E C V y m(V \ K) < e. 

Por definición de y de ¡jl existen K y V tales que 
lx (y)- e -<n{E)<»{K)+ e -. 

Puesto que V \ K es abierto, por 3) tenemos que V \ K € Mf, luego 4) 
implica que 

KK) + v(V\K) = n(V)<n(K) + e. 

6) Si A, B £ M F entonces A \ B, A U B, A n B e M F . 

Aplicamos el paso anterior a los conjuntos A y B, lo que nos da conjuntos 
Ki y Vi, para i = 1,2, de modo que K\ C A C Vi, K 2 C B C V 2 y 
jti(V¿ \ ifj) < e. Entonces 

C Vi \ tf 2 C (Vi \ #i) U (^i \ V 2 ) u (^2 \ ^2), 

luego el paso 1) implica [i(A \ B) < e + fJ,(Ki \ V 2 ) + e y K 1 \ V 2 es un 
subconjunto compacto de A\B, luego esto prueba que A \ B G Mf- 

Ahora, A U B = {A \ B) U B, luego el paso 4) implica que A U B G Mf y 
como AnB = i\(i\B), también AnB £ M F - 

7) M es una a-álgebra que contiene a la a-álgebra de Borel. 

Si A £ M y K es un compacto en X, entonces (X \ A) n K = K\ (An K), 
luego (X \ A) n K es diferencia de dos elementos de Mf, luego está en 
Mf, luego X\A £ M. 

00 

Sea A = |J una unión de elementos de M. Si es un compacto en X, 

i=l 

tomamos i?i = A x n ü" y B„ = (A„ n K)\ (Bi U • • • U B n _i, con lo que 
cada B n £ Mp y son disjuntos dos a dos. Por 4) tenemos que A(l K (la 
unión de los B n ) está en Mf, luego A £ M. Esto prueba que M es una 
cr-álgebra. 
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Si C es un cerrado de X y K es compacto, entonces C fl K es compacto, 
luego está en Mp, luego C € M. Por lo tanto M contiene a todos los 
cerrados, luego a todos los abiertos, luego a todos los conjuntos de Borel. 

8) Mi? está formado por los conjuntos de M de medida finita. 

Si E e Mjr, los pasos 2) y 6) implican que E D K G M F , luego £eM. 
Recíprocamente, si £ £ M tiene medida finita, dado e > 0 existe un 
abierto V que contiene & E y tiene medida finita. Por 3) y 5) existe un 
compacto K C V con ¡i{V \ K) < e. Como E fl K € Mp, existe un 
compacto H C E H con ní)< /¿(ií) + e. 

Puesto que E C (E (~) K) U (V \ if), resulta 

< »{E r\K) + fi(V \ K) < n(H) + 2e, 

luego E e M F . 

Tras estas comprobaciones ya estamos en condiciones de probar el teorema. 
Consideremos la restricción de /i a la a-álgebra de Borel. Los pasos 4) y 8) jus- 
tifican que esta restricción es una medida. Hemos probado que ¡jl es finita sobre 
los compactos, por definición se aproxima por abiertos y por 8) se aproxima por 
compactos en los conjuntos de medida finita. El argumento de 3) prueba de 
hecho que los abiertos de medida infinita contienen compactos de medida arbi- 
trariamente grande, luego \i se aproxima por compactos en todos los abiertos. 
Así pues fi es casi regular. 

Falta probar que \i representa a T. Dada / € C C (X), basta probar que 



pues aplicando esto mismo a — / obtenemos la desigualdad opuesta. Sea K el 
soporte de /. Entonces f[X] C f[K] U {0} es compacto, f[X] C [a, b], para 
ciertos números reales a y b. Sea e > 0 y tomemos números 



tales que y i+1 - y i < e. 

Sea Ei = {x £ X | y%-\ < f(x) < n K. Como / es continua, / es 
medible respecto al álgebra de Borel, luego los conjuntos E¡ son conjuntos de 
Borel disjuntos cuya unión es K. Existen abiertos Vi tales que E, C y¡, 



y f(x) < yi + e para todo x G V¿. Por el teorema 7.27 existen funciones /i¿ -< V¿ 
que suman 1 sobre K. Por lo tanto / = h\f H h n f y de 2) se sigue que 




yo < a < yi < ■ ■ ■ < y„ 



= b 



fx(K) < T(h! + ... + h n )= T(hi) + ■■■ + T{h n ). 
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Como hif < {yi + e)hi e y¿ — e < f(x) en £7¿, tenemos que 

n n 

T{f) = ]TT(/w-)<E^ + e ) T ^) 

2 = 1 2=1 

n n 

= J2(\a\+yi + e)T(hi)-\a\J2 T (hí) 

2 = 1 2=1 

n 

< J2(\a\+yi + e)(riEi) + ^)-\aMK) 

n n 



i=i i=i 

< í ¡d¡i + e{2^{K) + \a\+b+e). 
Jx 

Como e es arbitrario, tenemos la desigualdad buscada. ■ 

Recordemos que el teorema 7.5 implica que si el espacio X es er-compacto 
entonces las medidas que proporciona el teorema de Riesz son regulares. Una 
aplicación interesante del teorema de Riesz nos da que en espacios razonables 
(como M") toda medida razonable es regular: 

Teorema 7.29 Sea X un espacio ¡ocalmente compacto en el que todo abierto 
sea a-compacto. Si [i es una medida de Borel en X tal que todo compacto tiene 
medida finita entonces ¡i es regular. 

DEMOSTRACIÓN: Definamos el operador T : C C (X) — > R dado por T(f) = 
J x f d/j,. Notemos que si / tiene soporte K y M es una cota de / en K entonces 



\T(f)\ < í |/| df¿ < M^i(K) < +oo, 
Jx 



luego T está bien definido y claramente cumple las hipótesis del teorema de 
Riesz. Por lo tanto existe una medida de Borel regular v tal que para toda 
función / £ C C (X) se cumple 

Basta probar que ¡j, = v. Si V es un abierto, por hipótesis lo podemos expresar 
como unión de compactos {K n }^ =1 . Tomemos funciones K n -</„-< V y sea 
g n = máx{/i, . . . , /„}. Entonces g n £ C C (X) y es claro que la sucesión {g n }^Li 
es monótona creciente y converge puntualmente a \v- P° r el teorema de la 
convergencia monótona resulta que 

v(V) = lím / g n dv = lím / g n dfi = n(V). 
n Jx n Jx 

Así pues, /iy¡/ coinciden en los abiertos. 
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Dado un conjunto de Borel B, cortándolo con una familia creciente de com- 
pactos cuya unión sea X podemos expresarlo como unión creciente de conjuntos 
de Borel de medida finita para ¡jl y v, luego basta probar que ambas medidas 
coinciden sobre los conjuntos de Borel de medida finita. Por la regularidad de v 
es fácil ver que existen un abierto V y un compacto K tales que K C B C V y 
v(V \K) < e, para un e prefijado. Como V \ K es abierto, esta última igualdad 
vale también para \i. Por consiguiente: 

H(B) < n(V) = v(V) < v{B)+e, 
v{B) < u(V) = n(V) < v(B) + e, 

luego \fi(B) — v{B)\ < e para todo e > 0. ■ 

Terminamos la sección con un teorema importante sobre aproximación de 
funciones medibles por funciones continuas. 

Teorema 7.30 (Teorema de Lusin) Sea ¡i una medida de Borel regular en 
un espacio localmente compacto X y f : X — > R una función medible tal que 
f = 0 salvo en un conjunto de medida finita. Dado e > 0 existe una función 
g € C C (X) tal que f = g salvo en un conjunto de medida menor que e. Además 
podemos exigir que 

sup \g(x)\ < sup \f(x)\. 

x£X x£X 

Demostración: Sea A = {x e X | f(x) ^ 0}. Supongamos primero 
que A es compacto y que 0 < / < 1. Sea {Sn}^Li I a sucesión monótona 
creciente de funciones simples construida en el teorema 7.10. Definimos t\ = s\ 
y t n = s n — s n -i para n > 1. Entonces s n (x) = k n (f(x))/2 n y es fácil ver que 
k n (f(x)) = 2k n -i(f(x)) o bien k n (f(x)) = 2k n -i(f(x)) + 1, con lo que 2 n t n 
toma sólo los valores 0 y 1. En otros términos s n — Xt„, para ciertos conjuntos 
medibles T n C A. Además 

oo 

f(x) = t n (x), para todo x e X. 

n=l 

Sea V un abierto de clausura compacta que contenga a A. Por regularidad 
existen compactos K n y abiertos V n de manera que K n C T n C V n C V y 
fj,(V n \ K n ) < 2~ n e. Sea K n <h n < V n . Definimos 

oo 

g(x) = Y í '*~ n K(x). 

n=l 

Por el criterio de Weierstrass tenemos que g es continua. Además su soporte 
está contenido en la clausura de V, luego es compacto. Como 2~ n h n (x) — t n (x) 
excepto en V n \ K n , tenemos que f = g excepto en [j(V n \ K n ), que es un 
conjunto de medida menor que e. ™ 

Del caso anterior se deduce el teorema para el caso en que A es compacto y / 
está acotada. Para probar el caso general tomamos B n = {x € X \ \ f{x)\ > n}. 
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Estos conjuntos forman una familia decreciente con intersección vacía y todos 
tienen medida finita, luego ¡i{B n ) tiende a 0 con n. La función / coincide con la 
función acotada h = (1 — XB n )f salvo en B n y, por otra parte, podemos tomar 
un compacto K C A tal que ¡i(A\K) sea arbitrariamente pequeño, luego basta 
aproximar h\K por una función continua, lo cual es posible por la parte ya 
probada. 

Por último, sea K el supremo de |/|. Si K es finito consideramos la función 
h:R — > R dada por 

{x si \x\ < K 
— r si \x\ > K 
\x\ 

Claramente h es continua, g\= g°h sigue cumpliendo el teorema y además 
su supremo no excede al de /. ■ 



7.5 La medida de Lebesgue 

La medida de Lebesgue en R es la compleción de la medida que proporciona 
el teorema de Riesz cuando tomamos como aplicación lineal a la integral de 
Riemann. Así pues, la integral de Riemann y la integral de Lebesgue coinciden 
sobre las funciones continuas en R con soporte compacto. Es fácil ver que de 
hecho coinciden sobre toda función continua / sobre un intervalo [a, b]. Para ello 
extendemos / a una función /„ como indica la figura. Es claro que las funciones 
/„ son continuas en R, tienen soporte compacto y convergen puntualmente a /. 

Además están dominadas por una función de la forma i 

c X[a-i,h+i], para una constante c, luego por el teorema /'^**" \ n 

de la convergencia dominada tenemos que las integrales / ¡ ¡\ 
de las funciones /„ (Riemann y Lebesgue) tienden a la a _'i J, J b+¿- 

integral de lebesgue de /. Por otra parte, la integral de 

Riemann de /„ es la integral de Riemann de / más las integrales de Riemann 
en los intervalos [a — l/n,a] y [b, b+ 1/n], que están acotadas en módulo por 
una expresión de la forma K/n, luego tienden a 0. Así pues, las integrales de 
/„ convergen también a la integral de Riemann de /. 

Puede probarse de hecho que todas las funciones integrables Riemann son 
integrables Lebesgue. Desde un punto de vista geométrico la integral de Le- 
besgue no aporta nada a la integral de Riemann, pues todas las funciones de 
interés son continuas o tienen un número finito de discontinuidades y siempre 
son integrables Riemann, pero desde un punto de vista técnico la integral de 
Lebesgue es mucho más potente. Los teoremas de convergencia y en general 
todos los resultados importantes sobre la integral de Lebesgue son falsos para 
la integral de Riemann. 

Veamos ahora una construcción rápida de la integral de Riemann en IR™ y 
de ella obtendremos la medida de Lebesgue en R n . 
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Definición 7.31 Una celda en R™ es un conjunto de la forma 

W = {x e R" | a¿ < x l < 0i, i = l,...,n}, 

o cualquier conjunto obtenido reemplazando algunos de los signos < por < para 
algunos valores de i. 

El volumen de una celda es 

n 

Vol(W) = Y[(Pi-ai). 

¿=i 

Si a € IR™ y 5 > 0 llamaremos cubo de vértice a y lado S a la celda 

C(a, ¿) = {i € t" | o, < x, < a, + 5}. 

Para cada natural k > 0 llamaremos el conjunto de puntos de R™ cuyas 
coordenadas son de la forma t2~ k , para ígZ. Sea C¡t el conjunto de todos los 
cubos de lado 2~ fc con vértices en Ph. Sea 6 la unión de todos los conjuntos C¿. 

Teorema 7.32 Se cumplen las propiedades siguientes: 

a) R™ es la unión disjunta de los cubos de Cfc, para un k fijo. 

b) Si C e e fc y C e G r con r < k entonces CcC" o C H C = 0. 

c) Si C € Cfe, entonces Vol(C) = 2 kn y si r > k el conjunto P r tiene 
exactamente 2( r ~ fc )™ puntos en C. 

d) Todo abierto no vacio de R™ es una unión numerable de cubos disjuntos 

de e. 

Demostración: La única propiedad que no es obvia es la última. Si V 
es un abierto, es claro que cada x G V está en un cubo de 6 contenido en V . 
De entre todos los cubos de C contenidos en V tomamos todos los que están 
en Ci, añadimos los de C2 que no están contenidos en ninguno de los de Ci, 
añadimos los de 63 que no están contenidos en ninguno de los anteriores y así 
sucesivamente. El resultado es una familia numerable de cubos disjuntos de C 
cuya unión es V. ■ 

Si / : R™ — > R es una función con soporte compacto (no necesariamente 
continua) definimos 

T k (f) = 2- nk /(*)■ 

x£P k 

Claramente la suma tiene todos los sumandos nulos salvo un número finito 
de ellos. Si / € C C (R") tomamos una celda W que contenga a todos los cubos de 
C que cortan a su soporte. Como / es uniformemente continua (por 2.36), dado 
e > 0 existe un natural N tal que si \\x— x'W^, < 2~ N entonces \ f(x) — f(x') \ < e. 
Para cada C € Caí sean me y Me el ínfimo y el supremo de / en C (son todos 
nulos salvo un número finito de ellos). Sean g y h las funciones que en cada 
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cubo C toman respectivamente los valores me y Mq- Es claro entonces que 
g<f<hyh — g<e. Si k > N, la propiedad c) del teorema anterior implica 
que 

T N (g) = T k (g) < T k (f) < T k {h) = T N {h), 

luego los límites superior e inferior de la sucesión {Tfe(/)}^Li difieren a lo sumo 
en T^(h — g) < eVol (W). Esto implica que existe 

T(/)=límT fe (/). 

k 

La aplicación T : C c (R n ) — > R así definida es obviamente lineal (se trata 
de la integral de Riemann) y también es claro que se encuentra en las hipótesis 
del teorema de Riesz. 

Teorema 7.33 Existe una única medida de Borel m en W 1 tal que a cada celda 
le hace corresponder su volumen. 

Demostración: Tomamos como m la medida que proporciona el teorema 
de Riesz a partir del operador T que acabamos de construir. Consideremos una 
celda abierta W, es decir, un producto de intervalos abiertos. Sea E k la unión 
de todos los cubos de C k cuyas clausuras están contenidas en W. Estos son un 
número finito y su unión E k es una celda cuya clausura E está contenida en W . 
Tomemos E k -< fu -<W y sea g k — máx{/i, . . . , /fe}. Es claro entonces que 

Vol(£? fc ) < T(f k ) < T(g k ) < Vól(W). 

También es fácil comprobar que cuando k oo el volumen de E k tiende al 
de W, luego 

límT( 5fe ) = Km / g r dm = Vol (W). 

n n J x 

Por otro lado, {gk}kLi es una sucesión creciente que converge puntualmente 
a xw, luego según el teorema de la convergencia monótona el límite anterior es 
también m(W). 

Una celda cerrada se expresa como intersección decreciente de celdas abier- 
tas, luego las propiedades elementales de las medidas nos dan que m también 
asigna su volumen a cada celda cerrada. Puesto que ra toma el mismo valor en 
una celda abierta que en su clausura, lo mismo vale para cualquier tipo de celda 
que esté comprendida entre ambas. 

La unicidad es clara: dos medidas de Borel que asignen a cada celda su 
volumen toman valores finitos sobre los compactos (pues todo compacto está 
contenido en una celda), luego por el teorema 7.29 ambas son regulares. Puesto 
que todo abierto es unión numerable de cubos disjuntos (teorema 7.32), ambas 
medidas coinciden sobre los abiertos y por regularidad coinciden sobre cualquier 
conjunto de Borel. ■ 

Definición 7.34 La medida de Lebesgue en IR" es la compleción de la única 
medida de Borel que a cada celda le asigna su volumen. La representaremos 
por m. 



7.5. La medida de Lebesgue 



281 



La medida de Lebesgue se corresponde con el concepto geométrico de área y 
volumen en el caso de IR 2 y IR 3 . En efecto, todas las figuras planas que aparecen 
en geometría (polígonos, elipses, etc.) tienen una frontera sin área, por lo que 
a efectos de calcular su área podemos considerar indistintamente su interior o 
su clausura. Si trabajamos con su interior, sabemos que puede expresarse como 
unión numerable de cubos disjuntos, por lo que el área debe ser la suma de las 
áreas de estos cubos, que es precisamente el valor de la medida de Lebesgue. 
Lo mismo vale para figuras tridimensionales. Es importante notar que todos los 
argumentos clásicos para el cálculo de áreas de figuras curvilíneas presuponen 
de un modo u otro este principio de que el área se puede calcular a partir de 
descomposiciones infinitas numerables. 

Veamos ahora como se comporta la medida de Lebesgue frente a transfor- 
maciones afines. 

Teorema 7.35 Sea m la medida de Lebesgue en R™. Entonces: 

a) m es invariante por traslaciones, es decir, si x € IR™ y A C R™ es medible, 
entonces x + A es medible y m(x + A) = m{A) . 

b) Si f : R™ — > IR™ es una aplicación lineal de determinante A y A C IR™ es 
medible, entonces f[A] es medible y m(/L4]) = |A|ra(A). 

Demostración: a) Es claro que el conjunto de los trasladados x + B de los 
conjuntos de Borel forma una cr-álgebra que contiene a los abiertos, luego con- 
tiene a todos los conjuntos de Borel. Razonando igualmente con — x concluimos 
que los trasladados de los conjuntos de Borel son exactamente los conjuntos de 
Borel. Si definimos ¡jl(B) = m{x + B) tenemos claramente una medida de Borel 
y es fácil ver que a cada celda le asigna su volumen. Por consiguiente se trata 
de la medida de Lebesgue, es decir, tenemos que m(x + B) = m(B) para todo 
conjunto de Borel B. Teniendo en cuenta la definición de la compleción es fácil 
extender este hecho a todo conjunto medible. 

b) Supongamos primero que / es biyectiva. Puesto que también es continua, 
el mismo razonamiento que en el caso de las traslaciones implica que cuando B 
recorre los conjuntos de Borel de IR™, lo mismo sucede con f[B], así como que 
H(B) = m(f[B}) define una medida de Borel regular. La linealidad de / y el 
apartado anterior implican que ¡i es invariante por traslaciones. Sea C un cubo 
cualquiera de lado 1 y sea c = fJ,(C). Si C es un cubo de lado 2~ fe , entonces C 
se expresa como unión disjunta de 2™ fc trasladados de C, todos con la misma 
medida n(C'), luego /i(C") = c2~" fe = cm(C'). Como todo abierto V es unión 
numerable de cubos disjuntos de lado 2~ k , concluimos que /z(V) = cm(V), y 
por regularidad lo mismo vale para todo conjunto de Borel B, es decir, 

m(f[B]) = cm(B). 

A partir de la definición de compleción se concluye que esta relación es cierta 
para todo conjunto medible Lebesgue. 

Si / no es biyectiva entonces su imagen es un subespacio propio de R™. 
Basta probar que los subespacios propios de M™ tienen medida nula, con lo que 
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la relación anterior será cierta con c = 0. A través de un automorfismo, todo 
subespacio propio se transforma en un subespacio de V = {x G W 1 \ x\ = 0}. 
Por la parte ya probada basta ver que V es nulo. Ahora bien, V es unión 
numerable de cubos degenerados de la forma {0} x [— k, k] x • • • x [—k, k], luego 
basta ver que estos cubos son nulos, pero cada uno de ellos es intersección 
numerable de cubos [— 1/r, 1/r] x [— k, k] x • • • x [— k, k], cuya medida tiende a 0. 

Falta probar que la constante c es exactamente |A|. Si / no es biyectiva 
es evidente, pues hemos visto que c = 0. En caso contrario sabemos que c es 
la medida de la imagen por / de un cubo cualquiera de lado 1, por ejemplo 
C=[0,1[". 

Es conocido que todo automorfismo de IR™ se descompone en producto de 
automorfismos que sobre la base canónica {ei, . . . , e„} actúan de una de las tres 
formas siguientes: 

1) (/(ei), . . . ,/(e„)) es una permutación de (ei, . . . ,e„), 

2) /(ei) = aei, /(e¿) = e¿, para i = 2,...,n, 

3) /(ei) = ei + e 2 , /(e¿) = e¿, para i = 2,...,n. 

Teniendo en cuenta ademas que el determinante de la composición de dos 
automorfismos es el producto de sus determinantes, es claro que basta probar 
el teorema cuando / es de uno de estos tipos. 

Si / es del primer tipo tenemos A = ±1 y f[C] = C, luego c = 1 y se cumple 
el teorema. Si / es del segundo tipo entonces A = a y f[C] = I x [0, l[ n_1 , 
donde I = [Q,a[ o I = ]a, 0], según el signo de a, luego c = \a\ como queríamos 
probar. En el último caso A — 1 y f[C] es el conjunto de los iéR™ tales que 

Xi < X2 < X\ + 1, 0 < Xi < 1 si i ^ 2. 

Sea Si el conjunto de x e f[C] con x 2 < 1 y S2 = f[C] \ Si. Entonces 
C = Si U (S2 — e 2 ), y la unión es disjunta. Por lo tanto 

c = m(Si U S2) = íti(Si) + m(S2) = m(Si) + m(S2 — e 2 ) = m(C) = 1, 

luego el teorema está probado. ■ 

Con esto hemos obtenido una interpretación del módulo del determinante 
de una aplicación lineal /. Por ejemplo, si |A| = 3 esto significa que / triplica 
el volumen de los conjuntos. Recordemos que el signo del determinante ya lo 
interpretamos en el capítulo II. 

De momento no estamos en condiciones de calcular integrales de funciones 
de varias variables. Los resultados que nos permitirán trabajar cómodamente 
con tales integrales los veremos en los próximos capítulos, especialmente en el 
siguiente. De momento vamos a ver un ejemplo interesante de integral en R: 
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Definición 7.36 La función factorial 1 es la función II : ]— l,+oo[ — > IR dada 
por 



r+oo 

U(x) = / , 
Jo 



t x e _t dt. 



Recordemos que t x — e xl ° 6t . Vamos a probar que el integrando es realmente 
una función integrable en ]0, +oo[ para todo x > —1. Probamos por separado 
que es integrable en ]0, 1] y en [l,+oo[. 

Si x > 0 entonces t x e~ t es una función continua en [0, 1], luego es integrable. 
Si — 1 < x < 0 entonces (si 0 < t < 1) se cumple 0 < t x e~ l < t x , y la función t x 
es integrable: su integral es 



/ t x dt = lím / t x dt = lím 
Ja n Jl/n 



- t x+l - 


1 


■ t x+l - 


1 


1 


X+ 1 


1/n 


x + í_ 


0 


x+ 1 



La primera igualdad se sigue del teorema de la convergencia monótona. Siempre 
que tengamos una integral de una función no negativa definida sobre un intervalo 
y de modo que restringida a intervalos menores sea continua y acotada podemos 
aplicar esta técnica (aplicar la regla de Barrow en intervalos menores y tomar 
el límite). En situaciones similares pasaremos directamente del primer término 
al tercero sobrentendiendo el límite. 



Consideremos ahora el intervalo [l,+oo[. Observemos 



que 



lím 



t x e 



t-y+oo l/t 2 t-y+oo 



lím í x + 2 e-* 



o, 



(acotamos x + 2 por un número natural n y aplicamos n 
veces la regla de l'Hópital.) 

Esto implica que existe un M > 0 tal que si t > M 
entonces t x e~ l < l/t 2 . La función t x e~ l es continua en el 
intervalo [1, M], luego es integrable, luego basta probar que 
también lo es en [M, +oo[ y a su vez basta que lo sea l/t 2 , 
pero 



,+oo ^ 
J M ¿ 2 



dt = 



- +oo 



M 



1 

M' 




Con esto tenemos probada la existencia de la función II. La figura muestra 
su gráfica. ■ 

El teorema siguiente recoge las propiedades más importantes de la función 
factorial, entre ellas la que le da nombre: 



J La función factorial fue descubierta y estudiada por Euler, aunque fue Gauss quien la 
expresó en la forma que aquí usamos como definición. Legcndrc introdujo el cambio de 
variable T(x) = II (x — 1), que inexplicablemente ha prevalecido sobre la notación de Gauss 
y actualmente la función es más conocida como "función Gamma" . Nosotros respetamos la 
notación de Gauss pues, como veremos, resulta mucho más natural. 
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Teorema 7.37 La función factorial 

r+oo 

U(x) = / í x e-* dt. 
Jo 

es continua en ]— l,+oo[ y cumple la ecuación funcional 

n(a; + l) = (x + l)U(x). 

Además 11(0) = 1, de donde 2 H(n) = ni para todo número natural n. 

Demostración: Para probar que II es continua basta probar que lo es en un 
intervalo I = ] — 1 + e, M{. En este intervalo el integrando de II está mayorado 
por la función g(t) = t~ 1+e e~ t + t M e~* , que es integrable en ]0, +oo[, pues su 
integral es II( — 1 + e) + II(M). Si llamamos 



ií n (x) = r t x 

J-l+l/n 



dt, 

1+1/n 

el teorema 7.23 garantiza que II„ es continua en I y basta probar que II„ 
converge uniformemente a II en I. Ahora bien, si x € / tenemos que 

rl/n r+oo 

\n(x)-n n (x)\< g(t)dt+ g(t)dt, 

Ja Jn 

y es claro que el segundo miembro tiende a 0 con n. 

La ecuación funcional se obtiene integrando por partes. En efecto: 

r+oo r+oo 

n(x+l)= f +1 e-*dt = [-í x+1 e-*]g +(a;+l) / í x e"* dt = (x+l)Il(x). 
Ja Jo 

Claramente 11(0) = J 0 +O ° e _í dt = [— e -4 ],} 00 = 1 = 0!, luego por inducción 
tenemos la igualdad H(n) = n\ ■ 

Puede probarse que II es de clase C°° en su dominio. La función factorial 
tiene numerosas aplicaciones en análisis real y complejo, desde la estadística 
hasta la teoría de números. Nosotros no iremos más allá en su estudio, aunque 
más adelante veremos algún ejemplo adicional en torno a ella. 



2 Con la notación de Legendre las propiedades de la función factorial quedan distorsionadas. 
Por ejemplo, la función gamma cumple T(x + 1) = xF(x), T(n) = (n — 1)! 
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En este capítulo profundizaremos en la teoría de la medida hasta obtener 
los principales resultados necesarios para trabajar con integrales de funciones de 
varias variables. Los resultados más importantes serán el teorema de Fubini, que 
reduce el cálculo de la integral de una función de n variables al de n integrales 
sucesivas de funciones de una variable, y el teorema de cambio de variable, que 
generaliza al que ya conocemos para funciones de una variable (integración por 
sustitución) . 

8.1 Producto de medidas 

Aquí vamos a definir un producto de medidas, de modo que, por ejemplo, 
la medida de Lebesgue en R n será el producto de la medida de Lebesgue en R 
consigo misma n veces. Después probaremos el teorema de Fubini, que reduce 
el cálculo de una integral respecto a la medida producto al cálculo de integrales 
respecto a los factores. 

Definición 8.1 Sean X e Y dos conjuntos y A, 3 dos er-álgebras de subcon- 
juntos de X e Y respectivamente (a cuyos elementos llamaremos conjuntos me- 
dibles). Un rectángulo medible en X x Y es un conjunto de la forma A x B, 
donde A € A y B € H. Llamaremos figuras elementales a las uniones disjun- 
tas de rectángulos medibles. Llamaremos A x CB a la er-álgebra generada por 
los rectángulos medibles. Cuando hablemos de conjuntos medibles en X x Y 
entenderemos que nos referimos a los de A x 23. 

Si E C X x Y, x € X, y € Y, definimos las secciones de E determinadas 
por x e y como 

E x = {y e Y | (x,y) e E}, E^ = {x e X \ (x,y) e E}. 

Teorema 8.2 En las condiciones anteriores, si E es medible enXxY, entonces 
E x y E v son medibles en Y y en X respectivamente. 
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Demostración: Sea C el conjunto de todos los E g A x 25 tales que E x € 23 
para todo x G X. Si £ = i x B entonces E x = B para todo ir € A, y £7 X = 0 
si x ^ A luego todos los rectángulos medibles están en C. Ahora vemos que 6 
es una er-álgebra, de donde se sigue que A x 25 C 6, lo que prueba el teorema 
(para E x , el caso E y es análogo) . 

a) Obviamente X x Y g 6. 

b) Si £ € 6, entonces (X x y \ E) x = Y \ E x g 25, luego X x Y \ E € 6. 

OO OO 

c) Si {Ei}^ C 6 y £ = U £¿, entonces £ x = [j E ix g 25. Por lo tanto 

¿=i ¿=i 



Vamos a dar una caracterización de A x 25 que nos será útil después. Para 
ello definimos una clase monótona M en un conjunto X como una colección 
de subconjuntos de X tal que si {A i }^l 1 es una familia creciente de conjuntos 

OO 

de M (es decir, Ai C A i+1 ) entonces (J j4¿ € M y si la familia es decreciente 

¿=i 

OO 

(A í+1 c Ai) entonces f| A¿ € M. 

»=i 

Es claro que la intersección de clases monótonas es de nuevo una clase 
monótona, por lo que podemos hablar de la clase monótona generada por un 
conjunto, es decir, la menor clase monótona que lo contiene. 

Teorema 8.3 En las condiciones anteriores, A x 25 es la clase monótona ge- 
nerada por las figuras elementales. 

Demostración: Sea M la clase monótona generada por las figuras ele- 
mentales. Claramente A x 25 es una clase monótona que contiene a las figuras 
elementales, luego M C A x 25. Las igualdades 

(Ai x Bi) n (A 2 x B 2 ) = (Aj n A 2 ) x {B 1 x B 2 ) 
{A 1 xB 1 )\{A 2 xB 2 ) = ((A 1 \A 2 )xB 1 )u((A 1 nA 2 )x(B 1 \B 2 )) 

muestran que la intersección de dos rectángulos medibles es un rectángulo me- 
dible y que su diferencia es la unión de dos rectángulos medibles disjuntos, luego 
una figura elemental. De aquí se sigue claramente que la intersección y la di- 
ferencia de figuras elementales es una figura elemental. Lo mismo vale para la 
unión, pues P U Q = (P \ Q) U Q, y la unión es disjunta. 

Para cada conjunto P C X xY definimos Mp como el conjunto de todos los 
Q C X x Y tales que P\Q £ M, Q\PeMyPUQeM. Las propiedades 
siguientes son obvias: 

1) Q g M P si y sólo si P e Mq. 

2) Mp es una clase monótona. 
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Si P es una figura elemental, hemos probado que toda figura elemental está 
contenida en Mp, de donde 2) implica que M C Mp. Fijemos ahora Q € M. 
Si P es una figura elemental, por 1) tenemos que P € Mq, luego por 2) resulta 
que M C Mq. 

Con esto hemos probado que la diferencia y la unión de dos elementos de M 
está en M. Al añadir esto a la monotonía concluimos que M es una er-álgebra. 
En efecto, ciertamente X xY está en M, luego el complemento de un elemento 
de M está en M. Si {A i }^L 1 es una familia de elementos de M, entonces las 
uniones B¿ = Ai U • • • U Ai están en M, pero la unión de los Ai es la misma que 
la de los que está en M por monotonía. 

Puesto que las figuras elementales están en M, concluimos que A x 13 = M. 

■ 

Veamos ahora la relación entre la medibilidad de funciones en un producto y 
en los factores. Siempre en las mismas condiciones, si / : X x Y — > Z, x E X, 
y &Y, definimos f x : Y — > Z y f y : X — > Z como las aplicaciones dadas por 
f x (y) = f(x lV ), fy(x) = f(x,y). 

Teorema 8.4 Si f : X x Y — > Z es «na función medible, entonces f x es 
medible para todo x G X y f y es medible para todo y GY. 

DEMOSTRACIÓN: Si V es un abierto en Z, claramente / a T 1 [í / ] = / _1 [V] a; , 
luego es medible. Por lo tanto f x es medible. Igualmente se razona con f v . ■ 

Con esto estamos casi a punto de definir el producto de medidas. La defi- 
nición se apoyará en el teorema siguiente. 

Teorema 8.5 Sean X e Y espacios medida con medidas a-finitas ¡jl y v. Sea 
E un subconjunto medible de X x Y . Entonces las aplicaciones v(E x ) y n(E v ) 
son funciones medibles de x e y respectivamente. Además 

í v{E x )d¡i= í ^{Ey)du. 
Jx Jy 

Demostración: Notar que por el teorema 8.2 los conjuntos E x , E y son 
medibles, luego tiene sentido considerar v{E x ) y n{E v ). 

Llamemos 6 a la familia de todos los subconjuntos medibles de X x Y para 
los que se cumple el teorema. Vamos a probar que G tiene las propiedades 
siguientes: 

a) C contiene a los rectángulos medibles. 

oo 

b) Si {Qnj^Lx C C es creciente entonces Q = (J Q n e 6. 

n=l 

oo 

c) Si {Qn}ÍLi C S son disjuntos dos a dos entonces Q = (J Q n e 6. 

n=l 

d) Si {Qn\n=i C 6 es decreciente y Qi C U x V, con fj,(U),u(V) < +oo, 

oo 

entonces Q = f] Q n € 6. 

n=l 
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En efecto, si U x V es un rectángulo medible, entonces 
m ta\ í V si x eu 

Por lo tanto v((U x V) x ) = v(V)xui que es una función medible. Igualmente 
/x((f7 x VQj,) = n(U)xv- Las integrales valen ambas /j,(U)v(V), luego [/xF 
está en C. Esto prueba a). 

oo 

Para demostrar b) observamos que Q x = (J (Q n )x, y la sucesión es creciente, 

71=1 

por lo que v(Q x ) = lím v{{Q n )x) ■ Como los conjuntos Q n están en 6, las 

n 

funciones v([Q n )x) son medibles, luego su límite puntual v(Q x ) también lo es. 
Igualmente ocurre con n(Q y ). El teorema de la convergencia monótona da la 
igualdad de las integrales, luego Q ¡G 6. 

La prueba de c) es similar, usando ahora que v{Q x ) es la suma de las fun- 
ciones v((Q n )x) en lugar del límite. 

En el caso d) tenemos también v{Q x ) = Km¡/((Q n ) x ) , pero ahora la sucesión 

n ' 

no es monótona creciente. La única diferencia es que en lugar del teorema de 
la convergencia monótona usamos el teorema de la convergencia dominada. La 
hipótesis viy") < +oo garantiza que las funciones v((Q n )x) están dominadas 
por la función integrable \v ■ 

Estamos suponiendo que las medidas en X y en Y son er-finitas, lo cual 

oo oo 

significa que podemos expresar X = (J X n eY = (J Y n para ciertos conjuntos 

n— 1 n— 1 

medibles de medida finita que además podemos suponer disjuntos dos a dos. 

Sea ahora E un conjunto medible enlx^. Definamos E mn = Eíl (X m x Y n ) 
y sea M la familia de todos los conjuntos E tales que los E mn así definidos están 
en C. las propiedades b) y d) muestran que M es una clase monótona, mientras 
que a) y c) muestran que contiene a las figuras elementales. El teorema 8.3 
implica ahora que M contiene a todos los conjuntos medibles de X x Y. 

Así pues, para todo conjunto medible E, los conjuntos E mn están en 6, pero 
claramente E es unión disjunta de los E mn , luego por c) tenemos E G 6, es decir, 
todo conjunto medible E cumple el teorema. ■ 

Definición 8.6 Sean X e Y espacios con medidas a-finitas /x y v. Definimos 
la medida producto fi x v como la dada por 

(/xxi/)(Q)= [ v(Q x )dii(x)= ¡ ii{Q y )du{y). 
Jx Jy 

Con el teorema 7.16 se prueba fácilmente que ¡i x v es realmente una medida 
en la cr-álgebra producto. Además es claro que sobre los rectángulos medibles 
tenemos {¡i x v){A x B) = ¡i(A)v(B) (con el convenio 0 • oo = 0). 

Conviene dar una caracterización de la medida producto que no dependa del 
teorema anterior: 
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Teorema 8.7 Dados dos espacios X e Y con medidas a-finitas /i yv, la medida 
producto es la única que cumple que (¿¿ x v){A x B) = n(Á)v(B) para todo 
rectángulo medible Ax B. 

DEMOSTRACIÓN: Supongamos que dos medidas Ai y A2 se comportan sobre 

los rectángulos medibles como la medida producto. Descompongamos X = 

00 00 

U í„ey= |J Y n , para ciertos conjuntos medibles de medida finita disjuntos 

n— 1 n— 1 

dos a dos. Sea M la familia de los conjuntos medibles E de X x Y tales que 
Ai [E n (X m x Y n )) = \ 2 {E n (X m x Y n )) para todo m, n. Es claro que M es 
una clase monótona que contiene a las figuras elementales, luego por el teorema 
8.3 tenemos que M contiene a todos los conjuntos medibles. De aquí se sigue 
que las dos medidas coinciden sobre cualquier conjunto medible. ■ 

Veamos ahora que toda esta teoría es aplicable a la medida de Lebesgue en 
IR™. Primero probemos un hecho general: 

Teorema 8.8 Si X e Y son dos espacios topológicos con bases numerables, 
entonces el producto de las o -álgebras de Borel es la o-álgebra de Borel del 
producto. En particular el producto de medidas de Borel es una medida de 
Borel. 

DEMOSTRACIÓN: Si U y V son conjuntos de Borel en X e Y respectivamente, 
entonces U x Y es un conjunto de Borel en el producto, pues es la antiimagen 
de U por la proyección en X, que es continua, luego medible. Igualmente X x V 
es un conjunto de Borel, y también lo es U x V por ser la intersección de ambos. 
De aquí se sigue que todas las figuras elementales son conjuntos de Borel, luego 
también lo son todos los conjuntos medibles en X x Y. Recíprocamente, los 
productos de abiertos básicos U x V forman una base numerable de X x Y, 
luego todo abierto de X x Y es unión numerable de estos abiertos básicos, luego 
todo abierto de X x Y es medible, luego todo conjunto de Borel es medible. 



Teorema 8.9 La medida de Lebesgue en (restringida a los conjuntos de 

Borel) es el producto de la medida de Lebesgue en M. m por la medida de Lebesgue 
en M™ (restringidas ambas a los conjuntos de Borel). 

En efecto, es claro que las celdas son rectángulos medibles, y la medida 
producto coincide sobre ellas con la medida de Lebesgue, luego es la medida de 
Lebesgue. ■ 

Ahora probamos el teorema principal de esta sección: 

Teorema 8.10 (Teorema de Pubini) Sean X e Y dos espacios medida con 
medidas a-finitas fj, y v y sea f : X X Y — > [—00, +00] una función medible. 

a) Si f > 0, entonces las funciones 



I fxdv ( como función de x 




f y dfi (como función de y) 
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son medibles, y se cumple 

/ /c¡(/íx¡/)= / ( / f x dv\ dn= I ( / fydfi) dv. 
JXxY Jx \Jy / Jy \Jx / 

b) Si J x (J Y \f\ x dv\ d\i < +00, entonces f € x v). 

c) Si / € x v), entonces f x € L x {v) p.c.t. y, f y € P-c.t. x, y las 
funciones definidas en a) p.c.t.p. están en y L x (y) respectivamente 
y sus integrales coinciden (según se afirma en a). 

Demostración: a) Por el teorema 8.4, las funciones f x y f y son medibles, 
luego tienen sentido sus integrales. Si / = xq 5 para un cierto conjunto medible 
Q C X x Y, entonces a) se reduce al teorema 8.5 y a la definición de la medida 
producto. De aquí se sigue que las igualdades de a) son válidas cuando / es una 
función simple. En general existe una sucesión creciente de funciones simples 
{ s n}£°=i que converge puntualmente a /. Entonces es claro que {(s n ) x }^ =1 
converge puntualmente a f x y, por el teorema de la convergencia monótona 
concluimos que 



lím / (s n ) x dv= i f x dv. 
n Jy Jy 

Como las funciones simples cumplen a) tenemos que las funciones J Y (s n ) x dv 
son medibles y 

/ s n d(fixv)= ( (s n ) x dv ) dfj,. 
JxxY Jx \Jy J 

Consecuentemente el límite f Y f x dv es medible y aplicando el teorema de la 
convergencia monótona a los dos miembros de la igualdad anterior queda 

/ fd(¡J,xv)= lím ( / (s n ) x dv ) d\± = ¡ ( / f x dv)dix. 
JxxY Jx n \Jy ) Jx \Jy ) 

La otra igualdad se prueba análogamente. 

Las hipótesis de b) implican por a) que |/| es integrable, luego / también lo 

es. 

Para probar c) descompongamos / = /+ — /~. Tenemos que /+ y /~ son 
integrables. Por a) la integrabilidad de /+ significa que 

/ /M/x x v) = í ( f f+ dv) dfl < +00, 

JXxY Jx \JY J 

luego J Y f x dv ha de ser finita salvo a lo sumo en un conjunto nulo, y lo mismo 
el válido para J Y f~ dv. Salvo para los puntos x en la unión de los dos conjuntos 
nulos, tenemos que la integral 



J fx dv = J /+ dv - J f x dv 
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está definida y es finita, es decir, que la función J Y f x dv es integrable. Además 
/ / d(fj, xv)= f + d{n XI/)-/ /" d{n x v) 

JXxY JXxY JX 



IXxY 



¡ÁL ¡ * iv ) 



f+du)dfj,- | / f x dv)dn= I [ I f x dv ) d/j,. 

X \JY J JX 

La otra parte de c) es análoga. ■ 

En el caso de la medida de Lebesgue en R n sustituiremos dm por dx\ ■ ■ ■ dx n . 
En estos términos el teorema de Fubini (por ejemplo para dos variables) se 
expresa como sigue: 

/ f(x,y)dxdy= / ( / f(x, y) dx ) dy = / ( / f(x,y)dy)dx. 

JR 2 JR \JR J JR \JR / 

Si trabajamos con funciones continuas sobre un compacto no hemos de preocu- 
parnos de la integrabilidad. 

Ejemplo Vamos a calcular el área de la elipse E de semiejes a, y b, formada 
por los puntos que cumplen 



a 2 + & 2 " 



Dicha área viene dada por 



/ XE(x,y)dxdy = / ( / xe(x, y) dy ) dx. 

JR 2 JR \JR J 

La función XE(x,y) (como función de y para un x fijo) es nula salvo si 
— a < x < a, en cuyo caso vale 0 salvo si —b^/í — (x/a) 2 < y < b^l — (x/a) 2 , 
y en este caso vale 1. Por consiguiente la última integral es 



,a / r.b^J\-(xla) 2 \ ,a / 2 

/ / dy)dx= 2bJl-(-)dx 

J-a \J -by/l-{x/a) 2 J J-a * Va/ 



ra I pb^/l-(x/a) 2 
-a \J-b^/l-{x/a) 2 

El cambio x/a = sení transforma la integral en 



, r /2 2 , „ , r' 2 l+cos2í , n , 
2ab / eos 2 t dt = 2ab / dt = 2ab 

J-tt/2 J-tv/2 - 



t sen 2t 

+ 



2 4 

En particular, el área de un círculo de radio r es irr 2 . 



tt/2 

= nab. 

-tt/2 



Ejemplo Calculemos ahora el volumen de una esfera de radio r. Concreta- 
mente, sea S = {(x, y, z) G R 3 \ x 2 + y 2 + z 2 < r 2 }. Hemos de calcular 

/ Xs(x,y,z)dxdydz = i Xs{x,y,z) dydz) dx. 

JR3 J- r \Jm 2 J 
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Fijado x G ]— r, r[, la función (y,z) <— > xs( x iD-> x ) es I a función característica 
de un círculo de radio \Jr 2 — x 2 y la integral interior es el área de este círculo, 
o sea, vale n(r 2 — x 2 ). Así pues, el volumen de la esfera es 



/: 



7r(r 2 — x 2 ) dx - 



Trr 2 x 



irx° 



Ejemplo Vamos a generalizar el cálculo anterior. Sea 

B r " = {i£l" | x\ + --- + x 2 n <r}. 

Vamos a probar que m(B") = v n r n , para una cierta constante v n que también 
calcularemos. Razonaremos por inducción sobre n. El ejemplo anterior es el 
caso n = 3, para el cual v n = (4/3)7r, Claramente v-¿ = n. En general, si Xn 
es la función característica de B™ y fijamos x\ G ]— r, r[, la función (Xn)x! es la 
función característica de una bola en de radio ^Jr 2 — x\. Por hipótesis de 

inducción 

m(B n r )= f v n -i{r* - xi)W* dxi. 

J — r 

Hacemos el cambio de variable x\ = rsenO, con lo que 

r n/2 

m(S") = v„_ir" / cos n 9de. 

J-tt/2 

Si llamamos n n = f*^ 2 eos" 9 d8, hemos probado que m(S") = u„_iK„r n , 
luego el resultado es cierto para n con v n = v n -iK n . 

Con la notación del ejemplo de la página 147 tenemos que n n = [Io.n\l!^/2- 
Si suponemos n > 2 los cálculos de dicho ejemplo nos dan que 

n — 1 

n 

Una simple inducción nos da ahora que 

_ 2tt 

^n^n— 1 • 

n 

En efecto, basta usar la relación anterior y tener en cuenta que 

,tt/2 ,tt/2 

k 0 = dO = 7r, K\ = I eos 9 d8 = 2. 

J-tt/2 J-tt/2 

Por consiguiente w„ = w„_ik„ = w„_2/í n /í n -i. Así llegamos a las relaciones 

«1=2, W 2 = 7T, U„ = W n _i, 

n 

que nos permiten calcular fácilmente w„ para cualquier valor de n. m 



8.2. Espacios U> 



293 



8.2 Espacios L p 

En las secciones posteriores vamos a necesitar algunos resultados abstractos 
referentes a ciertos espacios de funciones integrables que estudiaremos aquí. 
Introducimos primero una noción elemental del análisis de una variable que nos 
va a ser de gran ayuda: 

Definición 8.11 Una función / : / — > IR definida en un intervalo abierto es 
convexa si cuando x,y £ I y 0 < X < 1 entonces 

/((l-A)x + Ay)<(l-A)/(x) + A/(y). 



La interpretación geométrica es clara: la gráfica 
de / ha de quedar por debajo del segmento que une 
los puntos (x, <j>(x)) e (y,4>(y)). 

Llamando z = (1 — A)x + Xy y despejando A 
vemos que la condición de convexidad equivale a que 
si x < z < y entonces 

(y - x)f(z) <(y- z)f(x) + (z- x)f(y), 



x (l-\)x+\y y 



lo cual a su vez equivale a 

/(z)-/(x) ^ f{y)-f{z) _ 

z — x ~ y — z 

Por el teorema del valor medio, de aquí se sigue que si / es derivable y /' es 
una función monótona creciente, entonces / es convexa. El recíproco también 
es cierto y fácil de probar, pero no lo necesitaremos. 

Diremos que dos números reales positivos p y q son conjugados si 

i + i = i. 

p q 

Es obvio que cada p > 1 tiene un único conjugado q > 1. El caso p = q = 2 es 
especialmente importante. Como los pares de conjugados aparecen normalmente 
como exponentes, es frecuente llamarlos "exponentes conjugados" . 



Teorema 8.12 (Desigualdad de Holder) Sean p y q exponentes conjuga- 
dos. Sea X un espacio medida y sean f,g : X — > [0, +oo] funciones medibles. 
Entonces 

jjgd^<^JjPd^j P (/ x 5 9 ^) 

DEMOSTRACIÓN: Llamemos A y B a los dos factores del segundo miembro. 
Si A = 0 entonces el teorema 7.22 implica que / = 0 p.c.t.p., luego fg = 0 
p.c.t.p. y la desigualdad es clara. Si A > 0 y B = +oo de nuevo es obvio. 
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Podemos suponer, pues, 0 < A < +oo y 0 < B < +oo. Llamemos F — f/A, 
G = g/B. Entonces 



F p dfi= / G p d^ = 1. (8.1) 
x Jx 

Supongamos que x tal que 0 < F(x) < +oo, 0 < G(x) < +oo. Entonces existen 
números syí tales que F(x) = e s / p , G{x) = é¡ q . Como l/p + 1/q = 1 y la 
función exponencial es convexa, concluimos que 

e s/ P +t/q < p -l e s +? -l e í. 

Por consiguiente, 

F(x)G(x) < p- 1 F(xY + q^Gix) 9 . 

Esta desigualdad es trivialmente cierta si G(x) = 0 o G(x) = 0, luego vale para 
todo x. Integrando y usando (8.1) resulta 



L 



FG dfi < p- 1 + q- 1 = 1. 

x 



De aquí se sigue inmediatamente la desigualdad de Hólder. ■ 

Teorema 8.13 (Desigualdad de Minkowski) Sea X un espacio medida y 
f,g : X — > [0, +oo] funciones medióles. Para todo p > 1 se cumple 

f r \ 1/p í r \ 1/p í r ^ 1/p 

{J x (f + g) p d») < [J x F ¿mJ + ¡ K J x g p 

DEMOSTRACIÓN: Podemos suponer que p > 1, que el primer miembro es 
mayor que 0 y que el segundo en menor que +oo. Como la función x p es convexa 
en ]0, +oo[ tenemos que 

¡ + !¡SP <Uf P + 9 P ), 



con lo que el primer miembro también es finito, es decir, las tres integrales son 
finitas. Sea q el conjugado de p. Escribimos 

(f + 9) p = f(f + g) p - 1 + 9(f + 9) p - 1 - 

Aplicamos la desigualdad de Hólder junto con que (p — l)q = p (porque p y q 
son conjugados). El resultado es 

J x f{f + 9) p - 1 d»< [j x f P d^j ¡I ' (J x (f + 9) p d¿) ^ . 
Intercambiando los papeles de / y g y sumando las desigualdades resulta 

j x U + 9) P d^ < (J x (f + gf df?j ^ ^ f p d¿) + Q x g p df?j 1/P ^j . 

Dividiendo entre el primer factor del segundo miembro y teniendo en cuenta 
que 1 — 1/q = 1/p tenemos la desigualdad buscada. ■ 
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Definición 8.14 Sea X un espacio medida, 1 < p < +oo y / : X — > E una 
función medible. Sea 

II/IIp= 

Llamaremos L p (fi) al conjunto de todas las funciones medibles / tales que 
H/llp < +oo. Notemos que L 1 ^) es el conjunto de todas las funciones inte- 
grables, tal y como ya lo teníamos definido. 

Por la desigualdad de Minkowski tenemos que si /, g € L p (/j.) entonces 
11/ + <?||í> < H/llp + llsllp- En particular / + g € ¿ p (/i). Por otra parte es claro 
que ||a/|| p = |a| ||/|| p , con lo que af € L p ([i). En particular vemos que L p {¡j) 
es un espacio vectorial sobre R. 

No es cierto que || || p sea una norma en L p (fi), porque existen funciones 
no nulas / tales que ||/|| p = 0 (las que son nulas p.c.t.p.). Ahora bien, es 
claro que las funciones de "norma" nula forman un subespacio vectorial de 
L p {[i). Usaremos también la notación L p {y) para referirnos al espacio vectorial 
cociente. Si dos funciones / y g están en la misma clase entonces f = g + h, 
donde \\h\\ p = 0, luego ||/|| p < \\g\\ p + 0 e igualmente tenemos la desigualdad 
contraria, luego ||/|| p = ||g|| p . 

Podemos definir la norma de una clase de funciones como la norma de cual- 
quiera de sus miembros. Al considerar clases de equivalencia sí tenemos un 
espacio normado, pues las funciones de norma 0 forman una única clase. 

Teorema 8.15 Sea X un espacio medida y 1 < p < +oo. Entonces L p (fi) es 
un espacio de Banach. 

DEMOSTRACIÓN: Sea {f n }^Li una sucesión de Cauchy en L p (fi). Basta 
probar que tiene una subsucesión convergente. Extrayendo una subsucesión 
podemos suponer que \\f n +i — fn\\ < 2~". Sea 

k oo 

9k = ^2 |/n+l - fn\, g = ^ |/n+l ~ fn\- 
n—1 n—1 

Claramente \\gk\\ P < 1 y aplicando el lema de Fatou a {gl}^ =1 concluimos 
que ||g|| p < 1. En particular g{x) < +oo p.c.t.x. Así pues, la serie 

oo 
n=l 

converge absolutamente p.c.t.a;. Definamos f(x) = 0 en los puntos donde no 
converja. Teniendo en cuenta quiénes son las sumas parciales de la serie, es 
claro que 

/O) = Km/„(x) p.c.t.a;. 

n 

Veamos que / € L p (fi) y que es el límite para la norma de la sucesión dada. 
Dado e > 0 existe un k tal que si m, n > k entonces \\f n — f m \\p < e - P° r el 
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lema de Fatou tenemos 

/ \f - f m \ p <\jm f \fn-f m \ p dfi<eP. 

JX n Jx 

Esto significa que ||/ - f m \\ p < e, de donde ||/|| p < ||/ fe || + e y por lo tanto 
/ € L p (n). También es claro ahora que / es el límite en L p (n) de la sucesión 
dada. ■ 

En la prueba del teorema anterior hemos visto lo siguiente: 

Teorema 8.16 Toda sucesión que converge en un espacio L p (fi) a una fun- 
ción f, tiene una subsucesión que converge puntualmente a f. 

En el caso de los espacios L 2 (/j,) todavía podemos decir más: 

Teorema 8.17 Sea X un espacio medida. Entonces L 2 (fi) es un espacio de 
Hilbert con el producto escalar dado por 

fg= / fgdti. 

Jx 

Demostración: La integral que define el producto escalar es finita, pues 
por la desigualdad de Hólder cumple en realidad que \fg\ < H/I^Ufflb- Clara- 
mente es bilineal y la norma que induce es precisamente la de L 2 (¿¿) . ■ 

Ejercicio: Sea fj, la medida en {1, ... , n} en la que cada punto tiene medida 1. Probar 
que L p (¡j.) = R" y que las normas || ||i y || ||2 son las definidas en el capítulo I. 

Terminamos el estudio de los espacios L p (/j,) con dos teoremas de densidad: 

Teorema 8.18 Sea X un espacio medida. Sea S la clase de las funciones 
simples que son nulas salvo en un conjunto de medida finita. Entonces S es un 
subconjunto denso de L p (^l) para 1 < p < +oo. 

DEMOSTRACIÓN: Es claro que S C L p (¡j). Tomemos primero una función 
/ > 0 en L p (fí). Sea {s n }^ =1 una sucesión monótona creciente de funciones 
simples que converja a /. Como 0 < s n < f es claro que s n € L p (fi), luego 
s n € S. Como |/ — s n \ p < f p , el teorema de la convergencia dominada implica 
que ||/ — s n \\ p converge a 0, luego / está en la clausura de /. Para el caso general 
aplicamos la parte ya probada a /+ y /~. ■ 

Teorema 8.19 Sea ¡i una medida de Borel regular en un espacio localmente 
compacto X. Entonces C C (X) es denso en L p {¡j) para 1 < p < +oo. 

Demostración: Consideremos la clase S del teorema anterior. Basta ver 
que toda función s € S puede aproximarse por una función de C C (X). Sea e > 0 
y K el supremo de s, que claramente es finito. Por el teorema de Lusin existe 
una función g £ C C (X) tal que g — s salvo en un conjunto de medida menor 
que e. Por consiguiente \\g — s\\ p < 2Ke x / p . ■ 
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Para enunciar más adecuadamente los próximos resultados conviene que mo- 
difiquemos nuestra definición de medida o, con mas exactitud, que introduzca- 
mos otro tipo de medidas distintas de las medidas positivas. Aunque pronto 
veremos la utilidad del nuevo concepto desde un punto de vista puramente ma- 
temático, quizá ahora sea más conveniente motivarlo mediante un ejemplo físico: 
la función que a cada región del espacio le asigna la cantidad de materia que 
contiene es un ejemplo de medida positiva (que podemos suponer finita), sin 
embargo, la aplicación que a cada región del espacio le asigna la carga eléctrica 
que contiene ya no se ajusta a nuestra definición de medida, porque puede tomar 
valores negativos, y pese a ello puede tratarse de forma muy similar. 

Definición 8.20 Sea A una c-álgebra en un conjunto X. Una medida signada 
(finita) en A es una aplicación ¡i : A — > M. tal que fi(0) — 0 y si {E n }^ =1 es 
una familia de conjuntos de A disjuntos dos a dos entonces 



Observar que en la definición está implícita la hipótesis de que las series 
de medidas de conjuntos disjuntos son convergentes (en el caso de las medidas 
positivas donde admitíamos el valor +oo esto era evidente). Más aún, la serie 
ha de converger absolutamente. En efecto, la serie (finita o infinita) formada 
por los términos correspondientes a los conjuntos E n con medida negativa ha 
de converger a la medida de su unión, y obviamente la serie de los valores 
absolutos converge al valor absoluto de la suma, es decir, los términos negativos 
convergen absolutamente. Lo mismo vale para los términos positivos, luego la 
serie completa también converge absolutamente. 

Conviene saber que toda la teoría que vamos a exponer sobre medidas signa- 
das se generaliza con cambios mínimos a medidas con valores complejos, pero no 
vamos a necesitar nada al respecto. Con esta definición, las medidas signadas 
sobre una cr-álgebra fija en un conjunto X forman un espacio vectorial real con 
las operaciones dadas por 



En particular, las medidas signadas de Borel en un espacio topológico X 
forman un espacio vectorial real. 

Ejemplo Sea X un espacio topológico y x £ X. Definimos la delta de Dirac 
de soporte x como la medida de Borel dada por 



Claramente se trata de una medida signada positiva. Si una región del 
espacio está ocupada por partículas puntuales en las posiciones Xi, . . . , x n con 




(ti + v)(E) = M (£) + v(E), (an)(E) = afi(E). 
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cargas eléctricas qi, . . . , q n , entonces la distribución de carga viene dada por la 
medida signada 

n 

M = qiSx ' ■ 

i=l 

También podemos considerar la medida positiva 

n 

¿=i 

que a cada región del espacio le asigna la cantidad total de carga que contiene, 
haciendo abstracción de su signo. Vamos a probar que a toda medida signada 
fi le podemos asignar una medida positiva \fi\ con una interpretación análoga a 
la de este ejemplo. ■ 



Definición 8.21 Sea ¡i una medida signada en un conjunto X. Llamaremos 
variación total de fi a la aplicación definida sobre la misma cr-álgebra que /i 
dada por 

oo 

|/i|(£0=sup¿|Aí(£ n )|, 

71=1 

donde el supremo se toma sobre todas las particiones {E n }^ =1 de E en conjuntos 
medibles disjuntos dos a dos. 

Tomando la partición formada únicamente por E obtenemos la relación 
\t i {E)\ < \fi\(E). Es inmediato comprobar que la medida \fj,\ construida en el 
ejemplo anterior es la variación total de fj, en el sentido de la definición anterior. 

Teorema 8.22 La variación total de una medida compleja es una medida po- 
sitiva finita. 

Demostración: Obviamente \n\(0) = 0. Sea {E n }^ =1 una partición de un 
conjunto medible E en conjuntos medibles disjuntos dos a dos. Sear„ < \n\(E n ). 
Entonces cada E n tiene una partición {£ nm }™ =1 de modo que 

oo 

r n < \l*( E nm)\- 

772 — 1 

La unión de todas las particiones forma una partición de E, con lo que 

oo oo 

5>«^ £ MEnm)\<\»\(E). 
7i—l m.n—1 

Tomando el supremo en todas las posibles elecciones de {r n }^i resulta que 

jr,\n\(E n )<\n\(E). 

n=l 
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Sea ahora {A m }^ =1 una partición de E en conjuntos medibles disjuntos dos 
a dos. Entonces {E n n A m }^ =1 es una partición de A m y , {E n n ^4 m }m = i es 
una partición de E n , luego 



£| M (A m )| = ¿ 



^ MA™ n 



oo oo 



- E E IMA* n 



m— 1 n— 1 

oo 



n=l m— 1 n— 1 

Como esto vale para toda partición de E, tenemos 

oo 

\n\(E)<J2\»\(En). 

n=l 

Falta probar que |/z| es finita. Supongamos que existe un conjunto medible 
E tal que \¡i\{E) = +oo. Sea t = 2(l + 1^(^)1)- Puesto que > í, por 

definición de variación total existen conjuntos medibles E n contenidos en i? y 
disjuntos dos a dos tales que 



t < J2 \KEn) 



n=l 

Sea P la suma de los términos \fi(E n )\ tales que n{E n ) > 0 y sea TV la 
suma de los \fj,(E n )\ tales que n{E n ) < 0. Por la desigualdad anterior tenemos 
t < P + N, luego t < 2P o bien t < 2N, según si N < P o P < N. Sea A la 
unión de los E n correspondientes a P o N según el caso, de modo que A C E y 
í < 2|/x(A)|, luego \n{A)\ > t/2 > 1. 

Sea ahora B = E\A. Entonces 

= - MAI > HA)\ \»(E)\ >\- \»(E)\ = 1. 

Así pues, hemos partido E en dos conjuntos disjuntos A y B tales que 
\fJ,(A)\ > 1 y |m(5)| > 1. Obviamente \fJ,\(A) = +oo o bien \fi\(B) = +oo. 

Supongamos ahora que el espacio total X tiene variación total infinita. Por 
el argumento anterior podemos partirlo en dos conjuntos medibles disjuntos 
X = Ai U B\ tales que \n\(Bi) = +oo y > 1. Aplicando el mismo 

razonamiento a Bi obtenemos B x = A 2 fl B 2 con |¿í|(£? 2 ) = +oo y |/i(A 2 )| > 1. 
Procediendo de este modo construimos una familia numerable de conjuntos me- 
dibles disjuntos {A n }^ =1 tales que |/z(A„)| > 1 para todo n. Debería cumplirse 



/ OO \ OO 

U An ) =E^( A ")' 

\n=l J n=l 



pero la serie no converge, porque su término general no tiende a 0. Esta con- 
tradicción prueba que |/u|(A) < +oo y por lo tanto \¡i\ es una medida finita. 
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Ejercicio: Probar que el conjunto de todas las medidas signadas sobre una a-álgebra 
en un conjunto X es un espacio normado con la norma dada por = 

Definición 8.23 Si [i es una medida signada en un conjunto X, llamaremos 
variación positiva y variación negativa de \i a las medidas (definidas sobre la 
misma cr-álgebra) dadas por 

+ _ H + M - _ H - M 
~~ 2 ' M ~ 2 ' 

Claramente son dos medidas positivas finitas y cumplen las relaciones 

¡j, = H + — fx~ , \fi\= /i + + . 

Por ejemplo, si /i representa la carga eléctrica contenida en una región del 
espacio, fi + y fi~ representan, respectivamente, la carga positiva y la carga 
negativa que contiene dicha región. 

Diremos que una función / : X — > IR es integrable respecto a una medida 
signada /i si lo es respecto a ¿¿ + y , y definimos su integral como 



/ fdfi= í fdu+- í fd»-. 
Jx Jx Jx 



Es fácil ver que el conjunto de las funciones integrables es un espacio 

vectorial y la integral determina sobre él una aplicación lineal. Además se 
cumple la desigualdad 



i fdv < í \f\d\n\. 
Jx Jx 



También es claro que la aplicación dada por v(E) = J E f d[i es una medida 
signada en X. 

Nos encaminamos a probar ahora uno de los teoremas más importantes de 
la teoría de la medida. Para ello necesitamos algunos conceptos y resultados 
previos. 

Definición 8.24 sea ¡i una medida positiva en un conjunto X y A una medida 
arbitraria (positiva o signada) en la misma a-álgebra. Diremos que A es abso- 
lutamente continua respecto a ¡i, y lo representaremos por A <C fi, si todos los 
conjuntos nulos para ¡i son nulos para A. 

Si existe un conjunto medible A tal que para todo conjunto medible E se 
cumple X(E) = X(A n E) se dice que A está concentrada en A. Esto equivale a 
que X(E) = 0 siempre que Eí) A = 0. 

Diremos que dos medidas arbitrarias (sobre una misma a-álgebra) son mu- 
tuamente singulares, y lo representaremos por Ai _L A 2 , si existen conjuntos 
medibles disjuntos A y B tales que Ai está concentrada en A y A 2 está concen- 
trada en B. 
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Ejemplo Si admitimos como principio que toda masa ocupa un volumen, en- 
tonces la medida ¡i que a cada región del espacio le asigna la masa que contiene es 
absolutamente continua respecto a la medida de Lebesgue m. Por el contrario, a 
veces es más conveniente trabajar con masas puntuales, es decir, suponiéndolas 
localizadas en puntos del espacio sin volumen. Este sería el caso de una distri- 

k 

bución de masas de la forma \i = Yl m nS Xn ■ Es fácil ver que entonces /i _L m. 

n=l 

■ 

He aquí algunas propiedades elementales: 

Teorema 8.25 Sean X, Ai y A 2 medidas arbitrarias en un conjunto X y p, una 
medida positiva, todas ellas con los mismos conjuntos medibles. Entonces 

a) Si X está concentrada en un conjunto medible A, también lo está \X\. 

b) Si Xi _L A 2 entonces \X\\ _L |A 2 |. 

c) Si Ai _L /i y A 2 i. p entonces Ai + A 2 -L \i. 

d) Si Ai <C \i y A 2 <C [i entonces X\ + A 2 <C yu. 

e) Si X <C [i, entonces \X\ <C \i. 

f) Si Ai <C \i y A 2 _L \i entonces X\ _L A 2 . 

g) SiX^fiyXJ-^ entonces A = 0. 

Demostración: a) Si E n A = 0 y {E n }^ =1 es cualquier partición de E, 
entonces X(E n ) — 0 para todo n, luego |A|(i?) = 0. 

b) Es consecuencia inmediata de a) . 

c) Existen conjuntos disjuntos Ai y B\ tales que Ai está concentrada en 
Ai y [i está concentrada en B\ e igualmente existen conjuntos disjuntos A 2 y 
B2 tales que A 2 está concentrada en A2 y n está concentrada en i? 2 . Entonces 
Ai + A 2 está concentrada en A = Ai n A 2 y \i está concentrada en B = Bi n B 2 . 

d) Obvio. 

e) Si n(E) = 0 y {E n }^Li es una partición de E en conjuntos medibles 
disjuntos, entonces /J,(E n ) = 0 para todo n, luego X(E n ) = 0 y |A|(.E) = 0. 

f) Tenemos que A 2 está concentrada en un conjunto A tal que n(A) = 0. 
Como Ai <C /i ha de ser Xi(E) = 0 para todo conjunto medible E C A. Por 
consiguiente Ai está concentrada en X \ A. 

g) Por f) tenemos A _L A, pero esto implica que A = 0. ■ 

Ahora probamos dos hechos elementales sobre medidas positivas que nos 
harán falta a continuación. 

Teorema 8.26 Si ¡j, es una medida positiva a-finita en un conjunto X , entonces 
existe una función w € tal que 0 < w(x) < 1 para todo x € X. 
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Demostración: Sea {E n }^ =1 una partición de X en conjuntos disjuntos 
de medida finita. Definamos 

w ( x ) = f 2~{l+\(E n )) SI X G E n 

Wn() \ 0 sixeX\E n 

oo 

La función w = ^2 w n cumple lo pedido. ■ 

71=1 

Teorema 8.27 Sea [i una medida positiva finita, / € L 1 (fx) y C C R un con- 
junto cerrado. Si 

para todo conjunto medible E no nulo, entonces f(x) € C p.c.t. x e X . 

DEMOSTRACIÓN: Sea / = [x — r, x + r] un intervalo cerrado disjunto de C. 
Puesto que IR \ C es unión de una familia numerable de tales intervalos, basta 
probar que E = es nulo. En caso contrario 



\P E (f)-x\= J 



jU- X )d lí \<^ ) j E \f-xW<r, 



H(E) 

lo cual es imposible, pues Pe(Í) £ C. ■ 
Finalmente podemos probar: 

Teorema 8.28 (de Lebesgue-Radon-Nikodym) Sea [i una medida positiva 
a-finita en un conjunto X y sea A una medida signada sobre la misma a-álgebra. 
Entonces 

a) Existe un único par de medidas signadas X a y X s tales que 

A = A a + A s , A a < ¡i, X s _L fi. 
Si A es positiva (y finita) también lo son X a y X s . 

b) Existe una única h £ ¿ a ¿ Q ue para todo conjunto medible E 

X a {E) = ¡ hdfi. 
Je 

La parte a) se conoce como Teorema de Lebesgue. La parte b) es el Teorema 
de Radon-Nikodym. 

Demostración: La unicidad de a) es clara a partir de 8.25, pues si A^, X' s 
es otro par que cumpla lo mismo, entonces A' a — A a = A s — A' s , A^ — A a <C ^ y 
X s - X' s _L fi, luego X' a - X a = X s - X' s = 0. 

La unicidad de h en b) (como función de ¿ 1 (/x), es decir, p.c.t.p.) es fácil de 
probar: si existe otra b! en las mismas condiciones entonces / = h — h' tiene 
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integral nula sobre todo conjunto. Tomamos E = {x € X | f(x) > 0} y, como 
/ tiene integral nula sobre E, por el teorema 7.22 concluimos que / — 0 p.c.t.p. 

Supongamos primero que A es positiva (y finita). Sea w según el teo- 
rema 8.26. Sea v la medida positiva finita dada por 

v{E) = \{E) + í wdfi. 

Je 

En otros términos, si / — \e se cumple 



f dv = f dX + fw dfi. 
Jx Jx Jx 

Claramente, la misma relación vale cuando / es una función simple y, en conse- 
cuencia, para funciones medibles no negativas. Si / € L 2 {v) la desigualdad de 
Hólder implica 

í fdX< í \f\dX< í \f\du<([ \f\ 2 dX' 2 viX) 1 ' 2 = viXf/^fh. 
Jx Jx Jx \Jx J 

Según el teorema 2.37, esto significa que 

/- f fdX 
Jx 

es una aplicación lineal continua de L 2 (v) en IR. Como L 2 {y) es un espacio 
de Hilbert, el teorema 2.44 implica que existe g € L 2 (y) tal que para toda 
/ € L 2 {v) se cumple 

/ fd\= í jgdv. (8.2) 
Jx Jx 

Si aplicamos esto a una función característica / = \e, donde v(E) > 0 el 
miembro izquierdo es X(E) y así 

-v(E)J E J v(E) ~ 

Según el teorema 8.27, resulta que g(x) € [0, 1] p.c.t.x (respecto a v). Puesto 
que g sólo está determinada como elemento de L 2 (v), podemos modificarla en 
un conjunto nulo y suponer que 0 < g(x) < 1 para todo x € X. Entonces (8.2) 
puede reescribirse como 



IX 

Sean 



(í-g)fdX= í fgwdn. (8.3) 
Jx 



A = {x £ X | 0 < g(x) < 1}, B = {x e X \ g(x) = 1}. 
Definimos las medidas A a y A s mediante 

X a (E) = X(AnE), X S (E) = X(BDE). 
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Haciendo / = xb en (8-3) el miembro izquierdo es 0 y el derecho es J B w d/j,, 
y como w > 0 concluimos que ¡J.(B) = 0, luego X s _L [i. 

Ahora aplicamos (8.3) a (1 + g + ■ ■ ■ + g n )xE, con lo que tenemos 

/ (l- 9 n+1 )d\= [ g(l + g+...+g») W dvi. 

Je Je 

El integrando de la izquierda es nulo en B y converge a 1 en A, luego la inte- 
gral de la izquierda converge a X(Ar\E) = X a (E). Por otra parte, el integrando 
de la derecha converge a una función medible no negativa h (quizá con valores 
infinitos), luego tomando límites en n resulta que 

X a (E) = f hdfi. 
Je 

En particular esto vale para E = X, lo que prueba que h toma valores fini- 
tos p.c.t.p., luego modificándola si es necesario en un conjunto nulo podemos 
suponer que h € £ 1 (m)- 

Esto prueba el teorema cuando A es positiva. Si es una medida signada 
arbitraria basta aplicar la parte ya probada a A+ y A~ . ■ 

Definición 8.29 Si ¡j, una medida positiva er-finita en un conjunto X y A es una 
medida signada sobre la misma er-álgebra tal que A <C fJ-, entonces la función 
h cuya existencia afirma el teorema de Radon-Nikodym se llama la derivada 
de Radon-Nikodym de A respecto a /i. La relación que expresa el teorema se 
representa también por dX = h dfi. 

Veamos una aplicación del teorema de Radon-Nikodym. Una interpretación 
del teorema siguiente es que si /i representa la distribución de carga eléctrica en 
el espacio, entonces el espacio puede dividirse en dos regiones, una íntegramente 
ocupada por cargas positivas y otra por cargas negativas. 

Teorema 8.30 (Teorema de descomposición de Hahn) Sea /j, una medi- 
da signada en un conjunto X. Entonces X se descompone en unión de dos 
conjuntos medibles disjuntos A y B tales que para todo conjunto medible E se 
cumple 

H + (E) = /i(AnE), n-(E) = -n(BnE). 

Demostración: Obviamente ¡i <C luego existe una función h £ ¿ 1 (|/i|) 
tal que dfi = hd\fi\. Veamos que h toma los valores ±1 p.c.t.p. Dado un número 
real r, sea A r = {x € X \ \h(x)\ < r}. Para toda partición {E n }^ =1 de A r se 
cumple 

OO OO p oo 

El^)l = E / MmI <Y J M{E n ) = r\ lí \{A r ). 

n=\ n=l n=l 

Para r < 1 esto implica que |/i|(A r ) = 0, luego \h\ > 1 p.c.t.p. Por otra 
parte, si \l¿\{E) > 0 tenemos que 



H(£) - ' 
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luego el teorema 8.27 implica que \h\ < 1 p.c.t.p. Modificando h en un conjunto 
nulo podemos suponer que h = ±1. Ahora basta definir 

A = {x e x | h(x) = i}, B = {iei|/i(i) = -i}. 

En efecto, por definición de /x + tenemos que para todo conjunto medible E 
se cumple 

li+{E)= l - f (l + h)d\n\= í hd\fí\ = n(E n A). 
2 J_b J EnA 

Igualmente se razona con la variación negativa. ■ 

Se dice que el par (A, B) es una partición de Hahn de \x. Como aplicación 
obtenemos un par de hechos de interés sobre la derivada de Radon-Nikodym de 
una medida signada: 

Teorema 8.31 Sea fj, una medida positiva a-finita en un conjunto X y f G 
L l (n). Sea A la medida signada determinada por dX = f dfi. Entonces |A| = 
|/| dfx y si g G L 1 (X) entonces gf € V 



f gdX= í , 
Jx Jx 



gfd/j,. 

Demostración: Claramente A < fi, luego |A| < fi, luego A + « /i y 
A~ <C /i. Por el teorema de Radon-Nikodym existen funciones /+, /_ € Z/ 1 (/x) 
tales que dX + = f + dfx, dX~ = /_ dfx. Si (A, _B) es una partición de Hahn para 
A, podemos exigir que / + se anule en B y / + se anule en A. Es claro que 
/ = /+ - f m p.c.t.p., luego |/| = /+ + /_ p.c.t.p. Por consiguiente d|A| = 
(f + + f.)dn.= \f\d t ¿. 

La segunda parte del teorema es obvia si g es una función simple. Si g es 
positiva tomamos una sucesión creciente {s n } de funciones simples 0 < s n < g 
que converja puntualmente a g. Entonces 

/ s n \f\ dfj,= s„d|A|. 
Jx Jx 

Por el teorema de la convergencia monótona concluimos que 

/ 9\f\dn= / gd\X\ < +oo, 
Jx Jx 

luego gf € L 1 (^l). También tenemos 

/ s n dX + - / s n dX~ = / s n fdfi 
Jx Jx Jx 

Aplicando el teorema de la convergencia monótona a la izquierda y el de la 
convergencia dominada a la derecha llegamos a la igualdad del enunciado. Si g 
no es positiva aplicamos la parte ya probada a g + y g~ . ■ 
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Para terminar probaremos una versión del teorema de Riesz para medidas 
signadas. Sea K un espacio topológico compacto y C(K) el espacio de todas 
las funciones reales continuas sobre K. Sabemos que C(K) es un espacio de 
Banach con la norma supremo. Sea C(K)' el espacio de las aplicaciones lineales 
continuas de C(K) en R, que también es un espacio de Banach con la norma 
dada por 

||T||=sup{|T(/)||||/|U<l}. 

Además, para toda / ¡G C(K) se cumple |T(/)| < ||T|| ||/||oo- Llamemos M(K) 
al conjunto de todas las medidas signadas de Borel en K, que claramente es un 
espacio normado con la norma = \¡x\{K). 

Teorema 8.32 (Teorema de representación de Riesz) Si K es un espa- 
cio compacto, a cada funcional lineal continuo T € C(K)' le corresponde una 
única medida signada [i G M(K) tal que para toda función f € C(K) se cumple 

T(f)= í fdfi. 

JK 

Además esta correspondencia es una isometría C(K)' — > M(K). 

Demostración: Si T fuera positivo, es decir, si T(f) > 0 cuando / > 0, la 
versión del teorema de Riesz que probamos en el capítulo anterior nos daría la 
medida que buscamos. En el caso general vamos a descomponer T en diferencia 
de dos funcionales positivos. Sea C~(K) = {/ e C(K) | / > 0} y definamos 

T+(f) = sup{T(u) \ueC+{K),u< /}, para / € C+(K). 

Notar que si 0 < u < f se cumple \T(u)\ < ||T|| WuW^ < \\T\\ \\f\\oo, luego T+ es 

finito y |r+(/)|<||r¡|||/|U. 

Es claro que si a > 0 se cumple T + (af) = aT + (f). Además T+(/ + g) = 
T + (f)+T+(g). En efecto, si0<u</y0<í;<5 entonces 0 < u + v < f + g, 
luego T(u)+T(v) < T+(f+g). Tomando supremos T+(/)+T+ (g) < T+(f+g). 
Recíprocamente, si w < f + g es claro que u = f/\wyv = w — u son funciones 
continuas y0<u<f,0<v<g, w = u + v, luego T(w) < T + (f) + T + (g) y, 
tomando supremos, T+(f + g) < T+(f) + T+(g). 

Dada / e C(K) definimos T+(f) = T+(/+) - T+(f~). Es fácil probar 
que T + : C(K) — > R es un funcional lineal continuo positivo. Lo mismo vale 
para T~ = T + — T. Por el teorema de Riesz para funcionales positivos existen 
medidas positivas [i + y ¿¿_ tales que 

T + (f)= f /d/i +) T"(/)= / d/i_. 

JK JK 

Ambas medidas son finitas (basta aplicar las fórmulas a / = 1). Por lo tanto 
podemos definir \i = ¡i + — ¿t_ , que es una medida signada en K y claramente 
representa a T. 
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Veamos que 



IITII. Si 



< 1 tenemos 



/ fd» < í 

JK JK 



\f\d\u.\<\u.\(K) = \\u.\\, 



luego ||T|| < Dado e > 0 consideramos una partición de Hahn (A,B) 

para \i. Sean K\ y K 2 conjuntos compactos tales que K\ C A, K 2 C B, 
/i + ( A) — fi + (Ki ) + n~ (B) — pT (K 2 ) < e. Es fácil construir una función continua 
/ : X — > [ — 1, 1] que valga 1 sobre K\ y — 1 sobre K 2 . Entonces 



y = / d^++ í dn- 

J A JB 



< / /d M +e = T(/) + e< ||T||+e, 



luego \\fi\\ < \\T\\. En particular tenemos que la correspondencia T 
inyectiva (su núcleo es trivial) y obviamente es suprayectiva. 



H es 



8.4 Derivación de medidas 

Supongamos que fj, representa la distribución de la masa en el espacio y m 
es la medida de Lebesgue. Si suponemos que fi < m, es decir, si la materia 
ocupa un volumen, entonces tiene sentido hablar de la densidad de materia en 
un punto x del espacio, entendida como la cantidad de materia por unidad de 
volumen. Una aproximación a dicha densidad es el cociente 

Mg) 

m(B)' 

donde B es un entorno de x. Sin embargo, si la distribución de la materia no 
es uniforme, dicho cociente no es exactamente la densidad, pero se parecerá 
más a ella cuanto menor sea el entorno considerado. Estas ideas nos llevan a la 
definición siguiente: 

Definición 8.33 Sea m la medida de Lebesgue en R n y una medida de Borel 
signada en IR™. Definimos los cocientes 

m(B r (x)) 

donde las bolas las tomamos respecto a la distancia euclídea. Definimos la 
derivada de \i en x como 

^f—(x) = Km C r u(x). 
dm r^o 

Probaremos que si ¡i <C m entonces la derivada existe p.c.t.p. Para ello nos 
apoyaremos en la función maximal M, definida por 



Mfi(x) = sup C r \/j,\(x). 

0<r<+oo 
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Veamos que es medible usando para ello el teorema 7.7. Sea E la antiimagen 
por Mfi de un intervalo ]t, +oo], es decir, E = {x € X \ M[i(x) > t}. Veamos 
que es abierto. Dado x £ E, existe un r > 0 tal que u = C r \fi\(x) > t, luego 
fi(B r (x)) = um(B r (x)). Tomemos 5 > 0 tal que (r + S) n < r n u/t. Así, si 
\y — x\ < S entonces B r {x) C B r+ s(y), con lo que 

\fj,\(B r+s (y)) > um{B r {x)) = u (^r^j m ( B r+s(y)) > tm(B r+s (y)). 

Esto prueba que y € E, es decir, tenemos que Bg{x) C E, luego E es abierto. 

■ 

Ahora necesitamos un par de hechos técnicos: 

Teorema 8.34 Sea W la unión de una familia finita de bolas B ri {xi) c W 1 , 
para i = 1, . . . , N. Entonces existe un conjunto S C {1, . . . , n} tal que: 

a) Las bolas B r .{xi) con i € S son disjuntas, 

b) WC U B 3n (xi), 

íes 

c) m(W) < 3" ¿2 m(B ri (x¿)). 

íes 

DEMOSTRACIÓN: Escribiremos _B¿ = B ri {xi). Ordenemos las bolas de modo 
que sus radios sean decrecientes. Sea i\ — 1. Eliminemos todas las bolas 
que corten a B il . Sea B Í2 la primera bola restante, si es que queda alguna, 
eliminemos las bolas que cortan a B Í2 y continuemos el proceso hasta que no 
queden bolas. Veamos que las bolas que hemos dejado cumplen el teorema. 
Ciertamente son disjuntas. Cada bola Bj de las que hemos eliminado está 
contenida en una bola B 3ri {xi), para algún i e S, pues si r' < r y B r >(x') corta 
a B r (x) entonces B r >(x') C B 3r (x). 

La parte c) es consecuencia inmediata de b) . ■ 

Teorema 8.35 Si ¡i es una medida signada de Borel en W l y t > 0, entonces 

on 

m({x e R n | M¡jl(x) > t}) < — \n\(R n ). 

DEMOSTRACIÓN: Sea K un subconjunto compacto del abierto que aparece 
en el miembro izquierdo. Cada x € K es el centro de una bola abierta B tal 
que \n\{B) > tm(B). 

Estas bolas forman un cubrimiento de K, del cual podemos extraer un sub- 
cubrimiento finito al que a su vez podemos aplicar el teorema anterior, digamos 
{Bi, . . . , Bk} de modo que 

n ~ n n ~ n 

m{K) < rJ2MB t ) < T 5>K S *) < -y 

i=l ' i=l 
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La medida /i es regular porque lo son sus variaciones positiva y negativa, 
luego tomando el supremo sobre todos los compactos K obtenemos la desigual- 
dad del enunciado. ■ 

Si / G L 1 (R n ) podemos aplicar el teorema anterior a la medida definida por 

H(E)= í \f\dm. 
Je 

En este caso Mu es la función 

Mf(x) = sup l i |/| dm 

0<r<+oo m{£S r {X) J Br (x) 

y la tesis del teorema es 

on 

m({x€R n \Mf(x)>t}) < T ||/||i. (8.4) 

La existencia de la derivada de una medida se deducirá de un teorema de 
existencia de puntos de Lebesgue, que definimos a continuación: 

Definición 8.36 Sea / € L 1 (W l ) (representaremos así al espacio L 1 (m), para 
la medida de Lebesgue en IR"). Un punto de Lebesgue de / es un punto x € W l 
tal que 

lím n m (fíM\ I Vf{y) dm{y) = °' 

Notemos que si x es un punto de Lebesgue entonces, dado que 



m(B r 



^ i fdm-f(x) = 1 / (f(y)-f(x))dm(y) 
'r{x)) J Bt {x) m{B r {x)) J Br[x) 



/ \f(y)-f(x)\dm(y), 

'r{x)) JB r (x) 



~ m(B. 
se cumple 

f(x) = lím 1 í fdm. 
r^o m(B r {x)) J Br(x) 

Es claro que si / es continua en x entonces x es un punto de Lebesgue para 
/, pero necesitamos la existencia de puntos de Lebesgue de funciones integrables 
cualesquiera: 

Teorema 8.37 Si f G ¿ 1 (M"), entonces casi todo x G IR" es un punto de 
Lebesgue de f. 
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Demostración: Sea 



Tr(f)(x) 



m(B r (x)) J Br[x) 




y sea 



T{f){x) = KmT r (/)(x). 

r— >0 



Tenemos que probar que Tf = 0 p.c.t.p. Fijemos un número real y > 0 y un 
número natural k. Por el teorema 8.19 existe una función g € C C (IR™) tal que 
||/ — g\\ — 1 < l/k. Sea h = f — g. La continuidad de g implica que T(g) = 0. 
Como 



tenemos que T(h) < Mh+ \ h\. Por otra parte, dado que T r (f) < T r (g) +T r (h), 
vemos que T(f) < Mh + \h\. Así pues, 



{x e | T(f)(x) > 2y} C {i € t" M(h)(x) > y} U {x € R n \ \h\(x) > y} 



Llamemos E(y 1 k) al miembro derecho de la inclusión anterior. Por 8.4 te- 
nemos que la medida del primero de los conjuntos de la unión es menor o igual 
que 3 n /(yk). Respecto al segundo, llamémoslo A, observamos que 



luego en total, m(E(y, k)) < (3™ + l)/{yk). 

El conjunto {x G W 1 \ T(f)(x) > 2y} es independiente de k y está contenido 
en la intersección de los conjuntos E(y, k) para todo k, que es nula. Por la 
completitud de la medida de Lebesgue concluimos que es medible Lebesgue y 
tiene medida nula. Como esto vale para todo y > 0 concluimos que Tf = 0 
p.c.t.p. ■ 

Con esto llegamos al teorema principal de esta sección: 

Teorema 8.38 Sea fj, una medida signada de Borel en W 1 tal que fi <C m y 
sea f la derivada de Radon- Nikodym de /i respecto a m. Entonces d/i/dm = f 
p.c.t.p. y para todo conjunto de Borel ÜCl" se cumple 



Demostración: El teorema de Radon-Nikodym afirma que se verifica la 
igualdad del enunciado con / en lugar de d/i/dm. Para cada punto de Lebesgue 
x de / se cumple 
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8.5 El teorema de cambio de variable 

En esta sección probaremos un teorema fundamental para el cálculo de inte- 
grales, junto con el teorema de Fubini. Se trata de la generalización a funciones 
de varias variables de la regla de integración por sustitución. El planteamiento 
es el siguiente: Supongamos que g : U — > V es un difeomorfismo entre dos 
abiertos en IR", el problema es relacionar la integral de una función / : V — > IR 
con la de g o /. Según el teorema 7.35, si g fuera una aplicación lineal de deter- 
minante A se cumpliría que m(g(Áj) = |A| m(A), para todo conjunto medible 
A C U. En este caso no es difícil deducir que 



/ fdm=\A\ / (jo f)dm. 
Jv Ju 



En el caso general, sabemos que en un entorno de cada punto x la aplicación g 
se confunde con su diferencial dg(x), que es una aplicación lineal de determinante 
A ff (x) = det Jg(x) (el determinante jacobiano de g en x). Esto se traduce en 
que si A es un conjunto medible contenido en un entorno de x suficientemente 
pequeño, entonces m(g(A)) sa \A g (x)\m(A). Esto es suficiente para llegar a un 
resultado análogo al caso lineal: 



/ fdm= í 
Jv Ju 



(9° f)\A g \dm 



Éste es el contenido del teorema de cambio de variable. La prueba detallada 
no es trivial en absoluto, sino que depende de una gran parte de los resultados 
que hemos visto hasta ahora. Observemos que dg(x) es de hecho un isomorfismo, 
luego A g (x) ^ 0. Comencemos probando la relación entre la medida de un 
conjunto y la de su imagen para el caso de bolas abiertas: 

Teorema 8.39 Sea g : U — > V un difeomorfismo entre dos abiertos de IR™ y 
x € U. Entonces 

m(g[B r (x)}) 

llm n (D f \\ A 3 ( X • 

Demostración: Puesto que la medida de Lebesgue es invariante por trasla- 
ciones, no perdemos generalidad si suponemos i = 0y g(0) = 0. Sea <fi = dg(0) 
y h = g o cj)^ 1 . Probaremos que 

Hm m(h[B r (0)]) = 1 
r^o m (B r (0)) 

El teorema 7.35 nos da que m(h[B r (Q)]) = \A g (0)\~ 1 m(g[B r (x)]^ , luego la 
igualdad anterior implica la que figura en el enunciado. La aplicación h cumple 
h(0) = 0 y además dh(0) es la aplicación identidad. Por definición de diferen- 
ciabilidad esto significa que 

h(x) — x 
lím -V- — = 0. 
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Así, dado 0 < e < 1 existe un S > 0 tal que 

si ||x|| < S entonces \\h(x) — x\\ < e\\x\\. (8.5) 

Como h es un difeomorfismo en particular es una aplicación abierta, luego 
podemos tomar S de modo que además Bs(0) está contenida en la imagen de h. 
Veamos que si 0 < r < S entonces 

B(i- e)r (0) C h[B r (0)] C B ( i +£)t .(0). (8.6) 

En efecto, si y € i?( 1 _ e ) r (0) C Bg(0) entonces existe un x € U tal que 
h(x) = y. La relación 8.5 implica \\y — x\\ < e\\x\\. Entonces 

ll^ll < - y\\ + \\y\\ < e \\ x \\ + (i — e ) r , 

luego (1 — e)||x|| < (1 — e)r y ||x|| < r. Así y € h[B r (0)]. Por otra parte, si 
y € h[B r (0)], es decir, si y — h(x) con < r, la relación 8.5 implica que 
\\y — x\\ < er, luego ||y|| < (1 + e)r, lo que nos da la otra inclusión. 
Tomando medidas en 8.6 resulta 

(l- e r<«<(l|er, P- todo, < 6, 
m{B r (0)) 

y la conclusión es clara. ■ 

En las condiciones del teorema anterior la aplicación g biyecta claramente 
los conjuntos de Borel de U con los de V, por lo que podemos definir una medida 
de Borel en U mediante fi(Á) — m(g[A]). Si se trata de una medida finita el 
teorema afirma que 

dm K 

En realidad no hay ningún problema en definir la derivada de una medida po- 
sitiva, aunque no sea finita, pues se trata de un concepto local, y la igualdad 
anterior es cierta en cualquier caso. Necesitaremos probar que fi <C m, lo que 
se seguirá del teorema siguiente: 

Teorema 8.40 La imagen de un conjunto nulo por una función diferenciable 
es un conjunto nulo. 

DEMOSTRACIÓN: Sea g : U — > V diferenciable y sea E C U un conjunto 
nulo. Si x G E, la diferenciabilidad de g en x significa que para y ^ x 

g(y) g(x) = \\y - x\\ (dg(x) + E{y x) 

donde E es una cierta función continua en 0 con E(0) = 0. Como dg(x) está 
acotada en la bola unidad, existen naturales k y p tales que 

si y G B 1/p (x) entonces \\g(y) - g(x)\\ < k\\y - x\\. 



(x)=A g (x). 
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Sea F kp el conjunto de todos los x € E que cumplen esta relación. Hemos 
probado que E está contenido en la unión de estos conjuntos. Por consiguiente 
basta probar que g[Fk p ] es nulo. 

Sea M el cociente entre la medida de una bola de radio 1 y la de un cubo de 
diámetro 1. Una homotecia de razón r los transforma en una bola de radio r y 
un cubo de diámetro r, cuyas medidas difieren de las anteriores en la constante 
r n , luego la razón entre ambas sigue siendo M, es decir, M es en realidad el 
cociente entre la medida de una bola de radio arbitrario r y la medida de un 
cubo de diámetro r. 

Sea e > 0. Cubramos Fk p por un abierto W tal que m{W) < e/M. Por 
el teorema 7.32 podemos descomponer W en una unión numerable de cubos 
disjuntos, que podemos tomar con diámetro menor que 1/p. Desechamos los 
que no cortan a F kp y así tenemos a éste cubierto por una familia numerable 
de cubos C¿ cuyas medidas suman menos de e/M. Cubrimos cada cubo por 
una bola B t = B ri {xi) cuyo centro es un punto Xi £ F kp n C¿ y su radio es 
el diámetro de C¿ (menor que 1/p). De este modo las bolas cubren a Fk p y la 
suma de sus medidas es menor que e. 

Si x G Fk p H E>i, entonces \\x — Xi\\ < 1/p yi,£ F kp , luego 

\\g(x) - g(xi)\\ < k\\x - Xi\\ < nr I7 

luego g[F kp n Bi] c Bk ri (g(xz))- Esto prueba que g[Fk p ] está cubierto por las 
bolas B kri (g(xi)), luego 

OO OO 

m{g[F kp ]) < Y,m{B kri (g{ Xi ))) = fc"^m(B 4 ) < k n e. 

i=i »=i 

Como e es arbitrario, tenemos que m(g[Fk p ]) =0. ■ 

Es claro que todo conjunto medible Lebesgue se puede expresar como unión 
de un conjunto de Borel con un conjunto nulo (el conjunto de Borel es la unión 
de una sucesión de compactos que aproximen la medida del conjunto dado). 
El teorema anterior prueba que si g : U — > V es un difeomorfismo entre dos 
abiertos de IR" y E C U es medible Lebesgue, entonces g[E] es medible Lebesgue. 
Veamos finalmente el teorema principal: 

Teorema 8.41 (Teorema de cambio de variable) Sea g : U > V un di- 
feomorfismo entre dos abiertos de R n y sea f : V — > R una aplicación integrable 
Lebesgue. Entonces 

f fdm= f (gof)\A g \dm. 
Jv Ju 

Demostración: Para cada natural k, sea U k = {x £ U \ \\g{x)\\ < k}. 
Claramente U k es abierto. Para cada conjunto medible E definimos fJ, k (E) = 
m(g[E n U k \). Claramente [i k es una medida finita sobre la er-álgebra de los 
conjuntos medibles Lebesgue en IR". El teorema anterior prueba que [i k <¡¿. m. 
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Ahora podemos aplicar el teorema 8.38, según el cual existe dp^/dm p.c.t.p., 
es integrable Lebesgue y para todo conjunto medible E se cumple 



En principio 8.38 prueba esto para conjuntos de Borel, pero la igualdad se 
extiende obviamente a conjuntos medibles arbitrarios. Del teorema 8.39 se sigue 
fácilmente que si x € Uk entonces 

En total hemos probado que si E es medible entonces 

m(g[EnU k }) = / X E\kg\dm. 
Ju k 

Por el teorema de la convergencia monótona concluimos que 

m(g[EnU]) = í X E\A g \dm. (8.7) 
Ju 

Vamos a deducir de aquí que si A es un conjunto medible, entonces 

/ \Adm= / (goxA)\A g \dm. 
Jv Ju 

Basta tomar E = g^ 1 (A) c U. El comentario previo al teorema prueba que 
E es medible y claramente xe = 9 ° Xa- Además g[E n U] = g[E] = AílV, 
luego (8.7) se convierte en la igualdad buscada. 

De aquí se sigue la fórmula del enunciado para el caso en que / es una función 
simple no negativa. Por el teorema de la convergencia monótona llegamos al 
mismo resultado para funciones medibles no negativas y a su vez se extiende a 
toda función integrable aplicándolo a /+ y /~. ■ 



Ejemplo Consideremos una curva cerrada en IR 2 que 
rodee a (0,0) y admita una expresión en coordenadas 
polares p — p(0) (es decir, que corte a cada semirrecta 
de origen (0,0) en un único punto). El recinto S limi- 
tado por la curva estará formado por los puntos (po, 9q) 
tales que 0 < p 0 < p{0 a ). Para calcular el área de S 




efectuamos el cambio de variables x = pcos8, y = psenO, cuyo jacobiano es p. 
Así, el área se puede calcular como 

f fP(8) /-27T 2 

/ dxdy= / / pdpd6= / ^-d9. 
Js Jo Jo Jo 2 

(Hemos aplicado el teorema anterior en el abierto 

{(p,e) | 0 < p < p(6),0 < 9 < 2tt}. 
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El cambio de coordenadas lo transforma biyectivamente en S menos el radio 
9 = 0, que tiene área nula, por lo que no importa despreciarlo.) 

Por ejemplo, el área de la cardioide p = (a/2)(l + eos 9) viene dada por 



„2 ¡-2-K 2 r 27T / 

— / (l+cos9) 2 d9= — l + 2cos6> + 

o Jo 8 JO V 



1 + eos 26» 



de 



9 + 2sen9 



6 sen 26» 



3tt 



o 2 . 



J o 



Ejemplo En el capítulo VI demostramos que los cuerpos sometidos a la acción 
gravitatoria de una estrella o planeta describen trayectorias rectas o cónicas, 
pero no calculamos la posición del cuerpo en función del tiempo. Ahora pro- 
baremos la segunda ley de Kepler, que aporta información a este respecto. Se 
refiere a un cuerpo (un planeta, un cometa) que describe una trayectoria cónica 
alrededor (digamos) del Sol: 

El radio que une el móvil con el Sol barre áreas iguales en tiempos 
iguales. 

Tomemos como origen la posición del Sol y sea p{6) la trayectoria del móvil. 
Sea A el sector de cónica que barre el radio que une al móvil con el Sol entre 
un ángulo 9q y un ángulo 6\. El área de A es 

í dxdy = ^ í p 2 d6. 

JA 2 Jg 0 

Hacemos el cambio 9 = 9(t), donde t es el tiempo. El resultado es 

\ ^ p\9{t))9\t) dt = \ j* 1 P 2 (tMt) dt=± j\dt = A (íl _ ío) . 

Así pues, el área barrida es proporcional al tiempo recorrido. 

A su vez de aquí se deduce la tercera ley de Kepler, válida para móviles 
que describen órbitas elípticas alrededor de un mismo cuerpo. El período de 
revolución de tal cuerpo es el tiempo que tarda en recorrer una órbita completa: 

Los cuadrados de los períodos de revolución son proporcionales a los 
cubos de los semiejes de las órbitas. 

Según vimos en el capítulo VI, la ecuación de la órbita es 

L 2 1 
P ~ GMm 2 1 + ecos9' 
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Los vértices mayores (los valores máximo y mínimo de p) se corresponden con 
los ángulos 6 = 0, tt. Su semisuma es el semieje mayor: 

L 2 1/1 1 \ L 2 1 



GMm 2 2 V 1 + e l-ej GMm 2 1 - e 2 ' 

Puesto que e es la excentricidad, el semieje menor es b = a\J\ — e 2 . El área 
de la elipse es 

A = nab = na 2 V^ 2 = m 4 (1 _ £ 2 )2 VT^. 

Según hemos calculado, el período T cumple A = LT/(2ra), luego 

~ G 2 M 2 ^(1-e 2 ) 2 ' 
Reuniendo todo esto vemos que 

T 2 4^ 2 



a 3 GM' 
luego tenemos la proporción buscada. 



Ejemplo Vamos a probar que 

f+OO 



/ 



e x dx = y/ñ. 



Aparentemente se trata de un problema de análisis de una variable real, pero 
el cálculo es mucho más simple si nos apoyamos en una función de dos variables. 
Concretamente consideramos f(x, y) = e~ x ~ v . Calculamos la integral de esta 
función en la bola de centro 0 y radio r mediante el cambio a coordenadas 
polares: 



í 2 2 Í 27T í'°° 2 

/ er x - y dxdy= / / e- p pdpd9 = 2n 

JB r (0) JO JO 



= n(í-e- r ). 
J o 



El teorema de la convergencia monótona implica que / es integrable en M 2 
y además 

dxdy = ir. 



J«? 



Por otro lado podemos aplicar el teorema de Fubini, que nos da 

2 

e~ x ~ dx) = tt, 
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luego tenemos la igualdad que buscábamos. De aquí se deducen varias integrales 
de interés. En primer lugar 

r 

y haciendo el cambio x = \fi resulta 

/•+OO 

n(-l/2) = / t- 1/2 e- t dt= v^F. 
Jo 

Por la ecuación funcional de la función factorial concluimos que 

11(1/2) = 1 n(-i/2) = ^. 



Ejemplo Con el cálculo que acabamos de hacer podemos dar una expresión 
explícita para las constantes v n que calculamos en en ejemplo de la página 292. 
En efecto, ahora es inmediato que 

pues esta función coincide con v n para n = 1 y n = 2 y satisface la misma 
relación recurrente que v n . En el capítulo siguiente daremos una prueba más 
elegante de esta fórmula. ■ 



Capítulo IX 

Formas diferenciales 



Después de haber dedicado el capítulo anterior a la integral de Lebesgue y 
los teoremas fundamentales de la teoría de la medida abstracta, nos ocuparemos 
aquí de sus aplicaciones al análisis real en la línea de los capítulos previos. Los 
únicos conjuntos medibles que nos van a aparecer serán obviamente de Borel: 
abiertos, cerrados, un círculo menos un punto o menos un radio, rectángulos 
semiabiertos como ]0,r] x ]0, 2n[, etc. Toda función continua / en un conjunto 
de Borel B (extendida como 0 fuera del mismo) es claramente medible y, si / 
está acotada y B tiene medida finita, entonces / es integrable. Este criterio 
bastará en la mayoría de los casos. Nuestro primer objetivo será definir una 
medida sobre las variedades diferenciables que se corresponda con el concepto 
de longitud, área y volumen cuando la dimensión sea 1, 2 y 3 respectivamente. 
De este modo podremos calcular, por ejemplo, el área de una esfera o el área 
de un círculo en el plano proyectivo. Notemos que la longitud de una curva ya 
está definida. La definición general que daremos aquí coincidirá con la que ya 
conocemos para las variedades de dimensión 1 . 

9.1 Integración en variedades 

Si queremos calcular el área de una esfera, lo primero que debemos pregun- 
tarnos es ¿qué es el área de una esfera? La pregunta es menos trivial de lo que 
parece, pues podemos calcular el área de cualquier figura plana razonable (es 
decir, medible Lebesgue), pero cualquier fragmento de esfera, por pequeño que 
sea, no es plano, y no es evidente cómo puede compararse su área con la de 
ninguna figura plana. Obviamente podemos definir aplicaciones de conjuntos 
planos en la esfera (difeomorfismos incluso, es decir, cartas de la esfera), pero 
nada nos garantiza que conserven el área, y difícilmente podríamos probar que 
así es sin tener de hecho una definición de área. 

Para hacernos una idea de lo que vamos a hacer pensemos en una esfera 
del tamaño de la Tierra. Si situamos sobre ella una baldosa plana de un metro 
cuadrado, no descansaría perfectamente sobre el suelo esférico, pero, suponiendo 
que se apoyara en su centro, cada esquina se levantaría tan sólo 0.04 mieras del 
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suelo. Resulta, pues, razonable considerar que el fragmento de la Tierra cubierto 
por la baldosa (aunque sea imperfectamente en teoría) tiene una superficie de 
lm 2 , salvo un error muy pequeño. Si cubrimos toda la Tierra con baldosas 
de lm 2 , aunque sin duda no encajarán a la perfección, el número de baldosas 
empleadas será una buena aproximación de la superficie de la Tierra, y el mínimo 
error cometido se podrá reducir arbitrariamente a base de considerar baldosas 
más y más pequeñas. 

Para formalizar (y generalizar) esta idea empezamos observando que si E n es 
un espacio vectorial euclídeo de dimensión n (por ejemplo un subespacio de R m 
de dimensión n con el producto escalar inducido desde M m ), entonces existe una 
isometría <f> : E n — > R" que es, de hecho, un homeomorfismo entre las topo- 
logías euclídeas. Definimos los conjuntos medibles de E n como las antiimágenes 
por 0 de los conjuntos medibles Lebesgue de W l y la medida de Lebesgue en E n 
como la dada por m(G) = m(ó(G)). 

Teniendo en cuenta que las isometrías en IR™ conservan la medida de Lebes- 
gue (tienen determinante ±1), es inmediato comprobar que ra así definida es 
una medida en E n que no depende de la elección de <f>. Claramente se corres- 
ponde con la noción de longitud, área, volumen, etc. en E n . El teorema 7.35 
puede enunciarse ahora en este contexto general: 

Teorema 9.1 Sea <f> : E n — > F n una aplicación lineal entre dos espacios 
vectoriales euclídeos de dimensión n y sea el determinante de la matriz de 
<p respecto a dos bases ortonormales cualesquiera. Entonces, para todo conjunto 
medible A C E n se cumple m(4>(A)) = \A<p\ m(A). 

DEMOSTRACIÓN: Sean / : R n — > E n y g : R n — > F n dos isometrías. Sea 
h = f°<l> o g— 1- Claramente el determinante de h es igual a A^ y 4> = f~ lQ hog. 
Basta aplicar el teorema 7.35 y el hecho de que / y g conservan la medida. ■ 

Así pues, si S C ffi m es una variedad diferenciable de dimensión n, para cada 
punto p € S tenemos definida la medida de Lebesgue en el espacio tangente T P S 
que es, según sabemos, una formalización adecuada del concepto de longitud, 
área, volumen, o una generalización natural de éste, según la dimensión n. 

Consideremos una carta X : U — > M. m , llamemos V = X[U], fijemos un 
punto p = X(x) y consideremos la diferencial dX(x) : K™ — > T p S. Para cada 
punto t £ U tenemos que 

X(t)f*p + dX(x)(t-p), 

de modo que, si t está suficientemente próximo a p, el punto X(t) e V "se con- 
funde" con p + dX(x)(t — p) € p + T p S. Por lo tanto, si B C V es un conjunto 
de Borcl en un entorno suficientemente pequeño de p y Bx = X~ l \B], el con- 
junto de Borel B l — dX(x)[Bx — x] C T p S cumple que p+ B l es prácticamente 
indistinguible de B. 

Particularizando esto al ejemplo de la Tierra que hemos considerado antes, 
si B es la superficie cubierta por una baldosa que se apoya en el punto p, 
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entonces p + B 1 es la baldosa tangente a la superficie terrestre. 1 Por ello, lo 
que vamos a hacer es probar que existe una medida de Borel regular fi en V 
con la propiedad de que si K C V es un subconjunto compacto y lo cubrimos 
por un conjunto finito de conjuntos de Borel _B¿ disjuntos dos a dos, entonces 
la suma de las medidas m(B¡) se aproxima a ¡J,(K), y la aproximación es mejor 
cuanto menores son los diámetros de los conjuntos _B¿. Esta propiedad justifica 
que consideremos a ¡j,(K) como el volumen de K . 

Empezamos calculando las medidas m{B t ): 

Teorema 9.2 Sea X : U — > IR m una carta de una variedad S. Sea X(x) = p. 
Para cada conjunto de Borel B c U se cumple m(dX(x)[B]) = Ax(x) m(B), 
donde Ax = i/det(g¿j) y las funciones gij son los coeficientes del tensor métrico 
deS. 

DEMOSTRACIÓN: Sea <j> : IR™ — > R m una isometría que transforme T p (S) 
en IR" x {0} y sea p n : IR" 1 — > IR" la proyección en las primeras componentes. 
De este modo la restricción a T P (S) de <j>op n es una isometría del plano tangente 
en R n , luego m(dX(x)[B}) = m((dX(x) o cf) o p n )[B\) . 

Sean A y P n las matrices de 0 y p n en las bases canónicas. Entonces la 
matriz de (dX(x) o (f> o p n ) es Jx(x)AP n y según el teorema 9.1 tenemos que 
m{dX{x)[B r )) = A x {x)m{B r ), donde A x (x) = \det(J x (x)AP n )\. Ahora usa- 
mos que para toda matriz cuadrada M se cumple | det M\ = ^/det(MM'), con 
lo que 

A x (x) = ^ det( J x (x)AP n P^ A* Jx(xY). 

Pero J x {x)AP n PlA t J x {x) t = J x (x)AA t J x (x) t . En efecto, el elemento 
de esta matriz es el producto de eiJx(x)AP n por (ejJx(x)AP n ) t , donde 
e¿ y ej son los vectores de la base canónica de IR", pero eiJx(x) <E T P (S), luego 
e%Jx{x)A € IR" x {0}, e igualmente e r Jx(x)A e IR" x {0}, luego el producto 
es el mismo aunque suprimamos P n . Como A es la matriz de una isometría, se 
cumple AA l = I, luego concluimos que 

A x (x) - ^/det(Jx(x)J x (xY) = yjdet( gij (x)). 

m 

Así, con la notación previa al teorema, tenemos que m(B t ) — A x (x) m(Bx). 
Ahora vamos a probar que la medida en V dada por 

H(B) = A x dm 

Jx-i-[B] 

cumple la propiedad requerida. 

1 A\ menos si elegimos la carta X de modo que la aplicación t i— » p + dX(x)(t — p) sea la 
proyección ortogonal en el plano tangente. Puede probarse que podemos elegir así la carta, 
pero no será necesario, porque la medida que vamos a construir sobre 5 no dependerá de la 
elección de ninguna carta de S. 
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Claramente n. es una medida de Borel regular en V. Es fácil comprobar que 
si / es una función integrable en V, entonces 



/ fdfi= í (Xof)A x 
Jv Ju 



dm 



(se prueba primero para funciones simples y luego para no negativas) . 

Sea ahora K dV un conjunto compacto, de modo que Kx C U es también 
compacto. Dado e > 0, como X^ 1 o Ax es uniformemente continua sobre K, 
existe un 8 > 0 tal que si p = X(x), q = X(y) € K cumplen \\p — q\\ < 8 
entonces 

^ X) -^ M< ^=l^mjKx)- 

Ahora consideramos cualquier cubrimiento finito de K por conjuntos de 
Borel Bi disjuntos dos a dos de diámetro menor que 8 (es fácil probar que 
existen tales cubrimientos) y tomemos puntos Xi € X _1 [.Bj]. Así, si a; € A _1 [B ¿ ] 
tenemos que \Ax{x) — Ax{xí)\ < e 0 . Por consiguiente: 

| E m(B¡) »(K)\ = | Um(B¡) n( Bl ))\ 

i i 

U*x(xí) m(X^m) J A x dm) 

i 

Y. !x-^[b^x{xí) - A x ) dm < E/jc-i[ B( ] \&x(xí)- A x \dm 

i i 

< eo^miX-^Bi]) = e 0 m(K x ) < e, 

i 

como había que probar. 

En principio tenemos definida una medida sobre la imagen de cada carta 
de la variedad S, pero a continuación probamos que todas estas medidas se 
extienden a una única medida en S que, en particular, no depende de ninguna 
carta en concreto: 

Teorema 9.3 Sea S C W n una variedad diferenciable de dimensión n. Enton- 
ces existe una única medida de Borel regular m en S tal que si X : U — > V es 
una carta y f es una función integrable en V, se tiene 

(X o f)Ax dm, donde Ax = ^Jdet(gij). 

Demostración: Consideremos dos cartas X : U\ — > V\ e Y : Ui — > V 2 y 
sea B C Vi f~l V2 un conjunto de Borel. Vamos a probar que 



/ Ax dm = / Ay dm. 



Restringiendo las cartas podemos suponer que Vi = V¿, y entonces basta 
aplicar el teorema de cambio de variable a la función / = X o Y -1 . En efecto, 
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se cumple que / : U\ — > Ui es un difeomorfismo y, como / o Y = X, tenemos 
J f (x)J Y (f(x)) = Jx(x), luego 

A 2 x (x) = det(J x (x)J x (x) t ) = det(J f (x)J Y (f(x))Mf(x)) t J f (x) t ) 
= det(J f (x)) 2 A Y (f(x)) 

y por consiguiente Ax(x) = Ay (f(x))\ det Jf(x)\ = Ay(/(x))|A/(x)|. Así: 



/ A x dm= Xx-i[i3]Ax dm = / (/ o Xr-0(/ ° Ay)|A/| dm 

JX-^B] JUi JUi 

= / xy- 1 [b]^ ¡ -y dm = / Ay dm. 
Ju 2 Jy- 1 \b] 



IU 2 JY- 1 [B] 

Con esto hemos probado que las distintas medidas que tenemos definidas 
sobre las imágenes de las cartas de S coinciden en su dominio común. El paso 
siguiente es "pegar" las medidas correspondientes a un número finito de cartas. 
Aunque intuitivamente es obvio que esto puede hacerse, formalmente conviene 
simplificar las comprobaciones usando el teorema de Riesz. 

Supongamos que X¿ : £/¿ — > V¿, para i = l,...,k son cartas de S con 
imágenes acotadas. Por el teorema 7.27 existe una partición de la unidad su- 
bordinada a los abiertos V¿, es decir, una familia de funciones /i¿ -< V¿ tales que 
h\ H h hk = 1. Sea V = Vi U • • • U V k . Para cada / € C C (V) definimos 

T(f)= í h 1 fd t t 1 + ---+ f hkfdfik, 
Jv 1 Jv k 

donde /U¿ es la medida asociada a la carta X¿. Claramente T es un operador 
lineal y positivo, luego existe una medida fienV tal que para toda / € C C {V) 
se cumple 

/ fdn= / hifdm-\ h / h k fdn k . 

JV JVt Jv k 

Si en particular tomamos / € C C (V¿) entonces /ij/ G C C (V¿ n V^), luego 

/ hjfdfj,j= / hjfdnj= / hjfdm= / hjfdm, 
JVj JVifWj Jv.nv-i JVi 

luego 

/ /d/i= / (ftiH \-hk)fdm= / /d/i¿. 

Por la unicidad del teorema de Riesz esto prueba que la restricción de ¡x a V¿ 
es precisamente /x¿, y es claro que esta propiedad determina a /i. En particular 
la construcción de ¡jl no depende de la partición de la unidad escogida. 

Finalmente "pegamos" todas las medidas asociadas a todas las cartas en una 
única medida en S. Para ello definimos un operador T : C C (S) — > R. Para 
cada / G C C (S) tomamos un número finito de cartas con imagen acotada cuya 



324 



Capítulo 9. Formas diferenciales 



unión cubra el soporte de /. Sea V la unión de las imágenes y ¡ly la medida 
sobre U que acabamos de construir. Definimos 

T(f)= f fdny. 
JV 

Es claro que T(f) no depende de las cartas con que cubrimos el soporte, pues 
si realizamos dos cubrimientos distintos V = V\ U • • • U Vk y V = V{ U • • • U V£, 
entonces cada abierto V¿ n V- es la imagen de dos cartas que inducen la misma 
medida y T(f) coincide con la integral de / en Vil V respecto a la única medida 
que extiende a todas ellas. Teniendo esto en cuenta es fácil probar que T es 
lineal y positivo, con lo que existe una única medida de Borel regular menS 
tal que 

/ fdm = T(f). 

Es claro que m extiende a la medida inducida por cualquier carta. El resto 
del teorema es ya inmediato. ■ 

La compleción de la medida construida en el teorema anterior se llama a veces 
medida de Lebesgue en la variedad S. Observemos que si tomamos S = M. n con 
la carta identidad, la medida del teorema es precisamente la medida de Lebesgue 
en W 1 (pues Ax = 1)- Lo mismo es válido si S es un subespacio vectorial de 
R m de dimensión n. 

En definitiva, hemos probado que si K C S está contenido en la imagen 
de una carta X y cubrimos K por un número finito de conjuntos de Borel Bi 
disjuntos dos a dos, las sumas ^ m (B¡), que en principio dependen de la carta X 

i 

y de los puntos p¿ G Bi respecto a los que se calculan las proyecciones, convergen 
cuando los diámetros de los conjuntos Bi tienden a 0, a la medida de Lebesgue 
m(K) que no depende de la carta ni de las elecciones de los puntos p¿. Podríamos 
generalizar esta propiedad para compactos no contenidos en el rango de una 
carta y para subconjuntos de Borel arbitrarios, pero no es necesario, puesto que 
el "volumen" que pretendemos definir sobre la variedad S debe extender a las 
medidas que hemos construido sobre las imágenes de las cartas (ya que cumplen 
la propiedad de aproximación que hemos tomado como condición necesaria para 
que la definición sea aceptable) concluimos que la única medida consistente con 
dicha condición es la medida de Lebesgue que acabamos de definir, luego es la 
única definición posible de volumen en una variedad. 

Demostraremos únicamente la siguiente relación local entre la medida de 
Lebesgue y las medidas de las proyecciones en los espacios tangentes: 

Teorema 9.4 Sea S C M™ una variedad diferenciable de dimensión n y sea 
X : U — > S H V una carta alrededor de un punto p G S. Sea x G U tal que 
X(x) = p. Para cada conjunto de Borel B C S fl V sea B l = dX(x)[X^ 1 [B]]. 
Entonces 

i- 4i - 1- 

B^ P m{B t ) 
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donde el limite ha de entenderse como sigue: Para todo e > O existe un entorno 
G dep en Sil V tal que si B C G es un conjunto de Borel no nulo en S entonces 
\m{B)/m{B t ) - 1| < e. 

Demostración: Dado e > 0, sea 5 = (e/2)A x {x). Por la continuidad 
de X^ 1 y Ax en x existe un entorno G de p tal que si y £ X~ 1 [G] entonces 
\Ax(y) — Ax(x)\ < S. Si E es un conjunto de Borel no nulo contenido en G y 
Bx = X~ X [B] tenemos que 

m(B x )(A x (x) -S)< m{B) = [ A x dm < m(B x )(A x (x) + S), 

Jb x 

m(B) 



luego 

Por consiguiente: 



m(B x ) 



A x (x)\ <5< A x (x)e. 



m{B) 



A x {x)m{B x ) 

pero por 9.2 tenemos que m{B t ) = m(dX(x)[Bx]) = Ax(x)m(Bx), con lo que 

m(B) 



m(B*) 



- 1 



< e. 



Ejemplo Si a : ]a, b[ — > IR™ es una curva parametrizada regular que no se 
corta a sí misma (de modo que su imagen es una variedad S de dimensión 1 con 
carta a) entonces J a (t) = a'(t), luego A Q (í) = ||a'(í)|| y por consiguiente 

m{S) = í \\a{t)\\dt 

Ja 

es la longitud de a tal y como la teníamos definida. 

Si S es una superficie en E 3 entonces el elemento de superficie se suele 
representar por da = V 1 EG — F 2 dm. Por consiguiente el área de una región C 
de S cubierta por la carta puede calcularse como 

A= í y/EG - F 2 dudv. 
Jx-^c) 



Ejemplo Vamos a calcular el área la superficie de revolución determinada por 
X = (r(u) eos v, r(u) sen v, z{u)) . 

Sabemos que 

E = r'(u) 2 + z'(u) 2 , F = 0, G = r(u) 2 . 
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Por lo tanto 

f 2-7T í-U 



A = 



/•ui /-tii 

/ r (u) \/r' (u) 2 + z' (u) 2 dudv = 2n / r(u)\/r'(u) 2 + z'{u) 2 du. 

Jun J Un 



JO Ju 0 Jun 

Si en particular z(u) = u, la fórmula se reduce a 



A = 2tt 



ru-i 

¡ r(u)\r'(u)\ du. 

J un 



Por ejemplo, el área de la esfera 
g(<p,0) — (Rsen(f>cos9, Rsencj)sen0, Rcoscj)), <p £ ]0,tt[,9 e ]0,27r[. 

es 

/•7T 

A = 2ir R 2 sen cf)d(l> = 4irR 2 . 
Jo 

Más detalladamente, si hacemos p — Rcf) entonces p es la distancia del punto 
(p, 9) al polo norte y las coordenadas 

x = i? sen cos#, y = i? sen sen#, z = Rcos-^-, 
R 1 y R ñ' 

son el análogo esférico a las coordenadas polares en el plano. El área de un 
círculo esférico de radio (esférico) r es 

A r = 2n / R 2 sen ^ dp = 2nR 2 (l - eos ^) = AttR 2 sen 2 

Jo R \ R) 2R 

Así, si r = 7tí? recuperamos el área de la esfera A-kR 2 , si r es pequeño con 
respecto a R entonces sen(r/i?) p¿ r/Ry por consiguiente A r tu irr 2 , el área del 
círculo plano del mismo radio. ■ 

*Ejemplo El ejemplo anterior particularizado a R — 1 nos da que el área de 
un círculo elíptico de radio r es 47rsen 2 (r/2). En particular el área del plano 
elíptico completo es 2tt. Es fácil ver que el área de un bilátero de ángulo a es 
2a. Dado un triángulo elíptico T de lados a, b, c y ángulos a, (3, 7, el plano 
elíptico es la unión de T y sus tres triángulos adyacentes. Si llamamos T a al 
triángulo adyacente por el lado a, tenemos que T U T a forman un bilátero de 
ángulo a, luego 

m(T) + m(T a ) = 2a. 

Sumando las ecuaciones análogas para los otros dos triángulos adyacentes 
llegamos a que 

3m(T) + m(T a ) + m{T b ) + m(T c ) = 2a + 2(3+ 2<y. 

Pero m(T)+m(T a ) + m(T b )+m(T c ) = 2n, pues es el área del plano completo, 
y por consiguiente 

m{T) = a + (3 + j — tt. 

Esto nos da una demostración analítica de que la suma de los ángulos de un 
triángulo elíptico es siempre mayor que n. m 
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* Ejemplo Consideremos ahora el plano hiperbólico. Según (4.6), el elemento 
de longitud hiperbólica en coordenadas polares es 

ds 2 = dp 2 + senh 2 p d9 2 , 

luego el elemento de área es da = senh p. El área de un círculo hiperbólico de 
radio r es 

2tt / senh p dp = 27r(coshr — 1) = An senh -. 
Jo 2 

Consideremos ahora un triángulo rectángulo como indica la 

figura. Tomemos como origen de las coordenadas polares 

el vértice A. Para hallar su área hemos de integrar da 

variando 9 entre 0 y a y, para un 8 dado, en virtud de la 

relación trigonométrica 

tanh b = eos 9 tanh p. 

vemos que p ha de llegar hasta 




argtanh 



tanh b 
eos 9 



Por lo tanto el área es 

/>argtanh(tanh bj eos í 



Jo Jo 



senh p dpdO 




1 dO 



tanh 2 b 
cos 2 6 



eos 6 



L 



0 \^/(cos 2 0-l) + (l-tanh 2 b) 
cosh b eos 9 



1 d6 



o l \J\ — (cosh b sen 9) 2 



1 1 de = arcsen(cosh b sen a) — a 



= aresen eos ¡3 — a= — — ¡3 — a = n — a — ¡3 — ~/. 

Todo triángulo hiperbólico T se puede expresar como la unión o la diferencia 
de dos triángulos rectángulos, de donde es fácil concluir que en general 

m(T) = 7r — a — (3 — 7. 

Esto prueba que la suma de los ángulos de un triángulo hiperbólico es siempre 
menor que ir. m 

El teorema siguiente nos conecta el teorema de Fubini con la integración en 
variedades: 



Teorema 9.5 Si Si C M. mi y S 2 C i™ 2 son variedades diferenciables, entonces 
la medida de Lebesgue en Si x S2 (restringida a los conjuntos de Borel) es el 
producto de las medidas de Lebesgue de Si y S2 (sobre los conjuntos de Borel). 
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Demostración: Sean m, mi y m 2 las medidas de Lebesgue en Si x S 2 , 
Si y S 2 respectivamente. Basta probar que si Ai y A 2 son conjuntos de Borel 
en S\ y ¿2 entonces m(Ai x A 2 ) = mi(Ai)m 2 (A 2 ) . Es fácil ver que Ai y A 2 
se descomponen en una unión numerable disjunta de conjuntos de Borel, cada 
uno de los cuales está contenido en el rango de una carta. También es claro que 
si probamos la igualdad anterior para los productos de estos abiertos de ahí se 
sigue el caso general. En definitiva, podemos suponer que Ai está contenido 
en el rango de una carta Xi y A 2 está contenido en el rango de una carta X 2 . 
Una simple comprobación nos da que Ax lX x 2 = AxjAx 2 , luego aplicando el 
teorema de Fubini concluimos que 

m{Ai x A 2 ) = / A Xl A X2 dx x ■ ■ ■ dx ni+n2 

Jx- 1 [A 1 ]xx- 1 [A 2 ] 

= ( / A Xl dxi ■ ■ ■ dx ni ) / Ax 2 dx ni+ i ■ ■ ■ dx ni+n A 

\JX-\A,] ) \Jx-\A-z\ ) 

= mi(Ai)m 2 (A 2 ). 



Terminamos la sección con una interpretación de la curvatura de Gauss de 
una superficie. De hecho se trata de la definición de curvatura que adoptó el 
propio Gauss. 

Teorema 9.6 Sea S una superficie y p un punto en el que la curvatura no sea 
nula. Sea n una determinación del vector normal en un entorno de p. Entonces 

m(n[E]) 

donde el límite se entiende en el mismo sentido que en el teorema 9.4. 

DEMOSTRACIÓN: Por el teorema 5.29 sabemos que K(p) es el determinante 
de dn(p), luego ésta diferencial es un isomorfismo. Sea g una carta alrededor de 
p y sea h = gon. Es fácil ver que h puede restringirse hasta una carta alrededor 
de n(p) en la esfera unidad. Del teorema 9.4 se sigue que 

„ m(E) „ m(n[E\) 

lím = 1, Km 



e — >p m(E t ) E^p m(n[E] 



y por otra parte n[E] t — dn(p)[E t ], luego m(n[E] t ) — \K(p)\m(E t ), de donde se 
sigue claramente el teorema ■ 



9.2 El álgebra exterior 

Si comparamos el teorema de cambio de variable tal y como lo enunciamos 
en el capítulo anterior con la fórmula de una variable 



rb rt(b) 

¡ u(x)dx= / u(x(t)) x \t) dt 

Ja Jt(a) 
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observamos una diferencia: la derivada x'(t) es el determinante jacobiano de 
la transformación x = x(t), pero aparece sin valor absoluto, con lo que un 
integrando positivo puede transformarse en un integrando negativo. Esto su- 
cede cuando la función x(t) es decreciente, pero entonces el intervalo [a, b] se 
transforma en el intervalo [t(b),t(a)] y, como los límites de integración aparecen 
invertidos, la integral se interpreta como cambiada de signo, lo cual compensa 
la ausencia del valor absoluto. 

En el caso general también es posible eliminar el valor absoluto en el determi- 
nante jacobiano que aparece en la fórmula de cambio de variable, a condición de 
considerar orientados los dominios de integración (exactamente igual que un in- 
tervalo [a, b] está orientado positivamente cuando a < b y negativamente cuando 
b < a, y en este caso la integral se considera cambiada de signo). La ventaja de 
este otro enfoque es que permite emerger a una potente teoría algebraica que 
subyace en el cálculo integral. 

Para separar esta parte puramente algebraica conviene trabajar en un es- 
pacio vectorial arbitrario E de dimensión n, tal y como hicimos al estudiar el 
tensor métrico de una variedad en el capítulo V. Al igual que allí, en la práctica 
sólo nos interesará el caso en que E es el espacio tangente T P (S) de una variedad 
S en un punto p. Mantendremos la misma notación que usábamos entonces: los 
vectores (v\, . . . , v n ) representarán una base arbitraria de E y (dx\, . . . , dx n ) 
representará su base dual, es decir, la base de E* determinada por 

dxi(vj) = Sij. 

En la práctica, cuando E = T p (S) la base considerada será siempre la asociada a 
una carta X de S alrededor de p, es decir, la formada por las derivadas parciales 
D\X(x), . . . , D n X(x), donde X(x) = p, con lo que su base dual será la formada 
por las diferenciales dx\{p), . . . , dx n (p), donde x\,. . . ,x n son las funciones en S 
que a cada punto le asignan sus coordenadas respecto a X. 

Definición 9.7 Sea E un espacio vectorial de dimensión n. Llamaremos para- 
lelepípedos orientados de E a las n-tuplas F = (v\, . . . , v n ) € E n . A cada F le 
asociamos el paralelepípedo no orientado P(F) dado por 

P(F) = {aivi H h a n v n | ai, . . . , a„ e [0, 1]} C E. 

Si los vectores de F son linealmente dependientes diremos que el paralelepípedo 
es degenerado. 

Habiendo fijado una base en E (y considerando positiva a su orientación), 
podemos dividir los paralelepípedos no degenerados en positiva y negativamente 
orientados, según que sus vectores determinen una base con la orientación del 
espacio o con la contraria (es decir, según si la matriz de cambio de base respecto 
a la base prefijada tenga determinante positivo o negativo). 

Si E es un espacio euclídeo, es claro que la medida de Lebesgue de P(F) 
se puede calcular como el valor absoluto del determinante de las coordenadas 
de los vectores de F en cualquier base ortonormal B de E (pues estas coorde- 
nadas son sus imágenes a través de la isometría de E en IR™ que transforma B 



330 



Capítulo 9. Formas diferenciales 



en la base canónica). Si suprimimos este valor absoluto tenemos una "medida 
orientada", que ya no es función de P(F), sino del paralelepípedo orientado F, 
y además depende de la base ortonormal B seleccionada. En efecto, la medida 
orientada es igual a la medida de P(F) si los vectores de F forman una base de 
E con la misma orientación que B y es dicha medida cambiada de signo en caso 
contrario. Si elegimos B con la misma orientación que la base (v Í7 . . . , v n ) prefi- 
jada, entonces podemos considerar que el signo de la medida orientada depende 
de esta base y, por consiguiente, de la orientación que le hemos dado a E. El 
inconveniente de que la medida dependa de la orientación se ve compensado con 
creces por el hecho de que la medida orientada sea esencialmente un determi- 
nante y, por lo tanto, una forma multilineal alternada de E n en IR. Las formas 
multilineales alternadas en un espacio euclídeo resultan ser el equivalente a las 
diferenciales de funciones en el caso de una variable. 

Definición 9.8 Sea E un espacio vectorial euclídeo de dimensión n. Llama- 
remos k-formas diferenciales (constantes) de E (o formas de grado k) a las 
aplicaciones multilineales alternadas oj : E k — > IR. 

Multilineal quiere decir que 

u(ui, . . . , aui + fiu'i, ...,u k ) = aw(ui, . . . , u¿, . . . , u k ) + f3u>(ui, . . . , u¿, . . . , u k ) 

para todo i = 1 , . . . , n y alternada quiere decir que al permutar dos vectores el 
valor de la forma cambia de signo o, más en general, que si a es una permutación 
de {1, ... , k}, se cumple 

uj{u a{1) , . . .,u a{k) ) = siger^Oi, . . . ,u k ), 

donde sig a es la signatura de la permutación. 

Llamaremos A k (E) al conjunto de todas las fc-formas de E. Claramente 
forman un espacio vectorial con la suma y el producto definidos puntualmente. 
Convendremos en que A°(E) = R. Definimos el álgebra exterior de E como la 
suma directa 

oo 

A(E)=@A k (E). 

k=0 

Es claro que una forma alternada se anula cuando dos de sus argumentos 
son iguales, luego también se anula al actuar sobre vectores linealmente depen- 
dientes (al desarrollar uno como combinación lineal de los demás la imagen de 
la forma se descompone en una combinación lineal de imágenes de fc-tuplas con 
dos componentes iguales). Esto implica que A k (E) = 0 para k > n y por lo 
tanto A(E) tiene dimensión finita. Vamos a estudiar ahora la estructura de los 
espacios A k (E) para k < n. 

Es claro que A 1 (E) es simplemente el espacio de aplicaciones lineales de E 
en R, es decir, el espacio dual de E, y tiene dimensión n. Una base la forman 
las diferenciales (dui, . . . , du n ). 
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Para obtener bases de los espacios de fc-formas de orden superior introdu- 
cimos el producto exterior de formas, definido como sigue: si lo G A k (E) y 
lo' e A k (E), entonces wAw' es la (k + fc')-forma dada por 

(wAw')Oi, . . .,U k+ k') = f(|7j "(^U)' ' ' ' ^ u <y(k)W( u a(k+l), ■ ■ -,Ua(k+k')), 



k + k' 



donde a recorre las permutaciones de {1, . . . , k + k'}. 

Es inmediato comprobar que lo Alo' es realmente una forma. Obviamente es 
multilineal y si t € entonces 



(wAw')( íi T(l)'---' U -r(fc+fe')) 

siga 
k\k'\ 



(^(^(l), . . . ,U aT ( k ))LO (,U<7T(fe+l)) ■ • • ! U 0-T(fe + fc')J 



Esigu-/ , 
^(m <tt (i), . . . ,u aT ( k ))u) {u aT {k+\), ■ ■ ■ , u aT (k+k')) 

= sigr(wAa; / )(wi,...,tífe+fc')- 

La definición dewAw' vale incluso si k — 0 o k' = 0. Por ejemplo, si fc = 0 
convenimos que co() = co € IR, con lo que 

(lo A w )(ui,.. . ,u fc 'j = 2^ UUJ ' -' u <r(fc')) 



= ¿J¡ wa;/ ("!>•••>'"£') = . . . ,u n ). 

<xe£ fc , 

Así pues, en este caso lo A lo' = lolo' (e igualmente si k' — 0). 



Teorema 9.9 El producto exterior tiene las propiedades siguientes (se entiende 
que lo, u¡' , lo" son formas de los grados adecuados para que tengan sentido las 
operaciones): 

a) (lo A J) A lo" = lo A {lo 1 A lo"), 

b) lo A <y + w") =wAw' + wA lo" , (lo + lo') A lo" = lo A w" + u/ A w", 
a(co A w') = (aw) Alo' = lo A (acó 1 ), para a GR, 

d) lo Alo' = {-l) kk ' lo' Alo. 

DEMOSTRACIÓN: a) Supongamos que lo, lo' y lo" tienen grados k, k' y k" 
respectivamente. Entonces 

((lo Alo') A lo") (m, . . . , u k +k'+k") = 
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(k + k')\k"V hU) >( Ua(1), ' ' ■> U *(k+k'))U (Uaik+k' + l), ■ ■ ■ ,U CT (fc+fe'+fe'')J 

^ siga y- sigr 

- (fcTfcOlF! ^ jfeíjfe7! w («-(i).- ■■'«-(*)) 

"■s^fc+fc'+d" r £^/c+fe' 

W (w CTr (/s + l), . . • , W < jr(fe+fe')) w "( M cr(fc+fc' + l)7 ■ • ■ 7 W<r(fe+fe'+fc"))- 

Si identificamos las permutaciones r € Sfe+fe' con las permutaciones de 
que fijan a los índices mayores que k + fc' la signatura es la misma y 
podemos escribir ctt en todos los subíndices. Entonces queda 

((wAu/) Aw")(ííi, . . . ,u k +k'+k") 

\r- y- sig CTT 

= (ifc + jfe/)!^!*//!^"^ 1 )'"-'"^)) 

""^^fc+i-'+fc" T £^fc+fc' 

w '( u o"r(fc+l)j ■ • ■ i u <TT(k+k')) UJ "( u <T(k+k' + l)7 ■ ■ ■ j u cr(fe+fc'+fc") ) ■ 

Claramente, ctt recorre (fc + fc')! veces cada permutación de T,k+k'+k", luego 
tenemos que 

((w A w') A w")(tti, . . . 

""É^fc + fc' + fc" 

LÜ " { u a(k+k' + l), ■ ■ ■ , u a(k+k'+k"))- 

Si partimos de wA(w'Aw") llegamos claramente a la misma expresión, luego 
(w A o/) Au" = wA (u/ A w"). 

Las propiedades b) y c) son inmediatas. Para probar d) supongamos que 
lü e A fc (£;) y w' € A fc '(£). Entonces 

wAw' = (-l) tt w'Aüi. 

En efecto, sea t e Sfe+fe' la permutación dada por 

i + k' si ¿ < k 
i — k si i > fc 



r(i) 

Es fácil comprobar que sigr = (— l) kk . Entonces 

sigo- 



(whJ)(ui, . . . ,Uk+k') = fcífcTÍ ' ' ' ; M <T(fc) VÍMfc+l); ■ ■ • ,U a (k+k')) 



7 ,, ,, ^(Uo-r(l), • • • ,«o-T(fc)JW (U CT T(fc+l), ■ • ■ ,M<Tr(fe+fe')) 



<t6S 



fc!fc'! 



/ -t\kk' \ ^ . \ l( \ 

\fcfcV / 



= (-1)** (o/ Aw)(ui,...,tí fc+fc 0. 
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Ahora extendemos el producto exterior hasta un producto en A(E) mediante 

(n \ / n \ n 

E w * A = E^ Aw í- 
»=0 / \j=0 / ¿,j=0 

Usando el teorema anterior se prueba sin dificultad que A{E) es un anillo 
(no conmutativo) con la suma y el producto exterior. La propiedad c) vale para 
elementos arbitrarios de A(E) (no necesariamente formas), lo que significa que 
el álgebra exterior es ciertamente un álgebra no conmutativa. 

Podemos comparar la construcción de A(E) y su estructura de álgebra con la 
construcción de los anillos de polinomios: las definiciones son las técnicamente 
necesarias para obtener las propiedades deseadas, pero una vez comprobados 
los hechos básicos estas definiciones pueden ser olvidadas y sustituidas por pro- 
piedades algebraicas naturales. Por ejemplo, un polinomio termina siendo una 
combinación de sumas y productos de indeterminadas sujetas a las propiedades 
de los anillos; igualmente un elemento de A(E) no es más que una combinación 
de sumas y productos de diferenciales sujetas a las propiedades de un álgebra 
no conmutativa. Para ver que esto es así hemos de observar que el argumento 
con el que hemos probado la asociatividad del producto exterior se generaliza 
sin dificultad para dar una expresión simétrica del producto de un número ar- 
bitrario de formas. Sólo nos interesa el caso en que los factores son 1-formas, 
que queda como sigue: 

Teorema 9.10 Si u>i, . . . ,u>k £ A 1 (E), entonces su producto exterior es la k- 
forma dada por 

(ll>i A • • • A ...,u k )= ^2 s ' 1 S (JUJ i( u t(i)) ■ ■■Uk{u< T (k)) = det(üJi(uj)). 

En particular 

(dx it A • • • A dx ik )(ui, . . . , u k ) — áet{dx lr {uj)). 
Más concretamente, si i\ < ■ ■ ■ < i k , ji < ■•• < jk, entonces 



(dx i± A • • • A dx ik )(v h ,. . .,v jk ) = 



1 siii=ji,...,i k =jk 
0 en otro caso, 



pues dx ir (vj 3 ) = 5i r j s y el determinante será nulo en cuanto algún i r no figure 
entre los j s o viceversa. Con esto ya es fácil obtener la expresión general de una 
/c-forma: 

Teorema 9.11 Toda forma uj G A k (E) se expresa de forma única como 



^ a il ... ik dx il A • • • A dx ik , con a^...^ el. 
<■■■<** 

Concretamente cti 1 ---i k = w(u¿ 15 . . . ,v ik ) GR. 



uj = 

ii<---<ik 
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Demostración: Llamemos <J al miembro derecho de la igualdad. Para 
probar que w = o/, por la multilinealidad es suficiente comprobar que ambas 
coinciden sobre los vectores básicos Vj 1 ,. . . , Vj k , y como son alternadas pode- 
mos suponer además que ji < ■ ■ ■ < jk- La observación anterior prueba que 
oj'(vj 1 , . . . , Vj k ) — aj 1 ...j k = Lo(vj 1 , . . . , Vj k ). La unicidad es clara. ■ 

Por consiguiente, la dimensión de A k (E) es (^) y la dimensión del álgebra 
exterior A(E) es 2™. Como última observación general para operar en A(E) 
observemos que 

dxi A dxj = —dxj A dx i} 
luego en particular dx¿ A dx¿ = 0. 

Ejemplo Tomemos E = E 3 con la base canónica. Entonces una base de 
A 1 (IR") la forman las tres diferenciales dx, dy, dz, y una 2-forma arbitraria es 

lo = adx A dy + bdx A dz + cdy A dz, con a,b,c € E. 

Calculemos por ejemplo: 

u A (dx + dy) = adx A dy A dx + bdx A dz A dx + cdy A dz A dx 
+ a dx A dy A dy + b dx A dz A dy + cdy A dz A dy 
= cdx A dy A dz — bdx A A dz = (c — b) dx A A dz. 

Vemos así que las formas se manipulan fácilmente sin necesidad de recurrir 
en ningún momento a las definiciones de las operaciones, sino tan sólo usando 
sus propiedades algebraicas. ■ 

Para terminar con las generalidades sobre formas diferenciales demostrare- 
mos el teorema siguiente: 

Teorema 9.12 Sea E un espacio vectorial de dimensión n y sean (vi, . . . ,v n ), 
(v[ , . . . , v' n ) dos bases de E. Sean (dx\, . . . , dx n ) y (dx[, . . . , dx' n ) sus bases 
duales respectivas. Sea A la matriz de cambio de base (es decir, la matriz cuyas 
filas son las coordenadas de los vectores Vi en la segunda base). Entonces 

dx[ A • • • A dx' n — det A dx\ A • • • A dx n . 

Demostración: Sea A = (a¿j). Entonces u¿ = anv[ + - ■ - + a in v' n , de donde 
dx'j(vi) — üij. Por el teorema 9.10 tenemos que 

(dx[ A • • • f\dx' n )(vi, . . . , v n ) — det(dx'j(vi)} = det A (dx\ A • • ■ Adx n )(vi, . . . ,v n ). 



Esto implica que ambas formas son iguales. 
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9.3 El álgebra de Grassmann 

En la sección anterior hemos estudiado las formas diferenciales en un espacio 
vectorial. Ahora pasamos a definir formas sobre variedades diferenciables. La 
relación entre unas y otras es la misma que la que hay entre vectores y cam- 
pos vectoriales, sólo que a los "campos de formas" se les llama simplemente 
"formas" : 

Definición 9.13 Sea S una variedad diferenciable. Una k-forma diferencial en 
S es una aplicación ui que a cada p € S le asigna una fc-forma ui(p) £ A k (T P (S)) . 

Observar que una 0-forma es simplemente una función / : S — > R. 

Si X : U — > V C S es una carta de S y p € V, entonces una base de 
A k (T p (S)) está formada por las formas 

dx il (p) A • • • A dx ik {p), con 1 < i x < ■ ■ ■ < i/. < n. 

Por consiguiente, para todo p £ V se cumplirá que 

u(p)= ^2 a il ... ik {p)dx il {p) A • • • A dx lk (p), (9.1) 

l<¿i<-<¿ fc <n 

para ciertas funciones a^...^ : V — > R, llamadas coeficientes de la forma 
en la carta dada. Si consideramos otra carta alrededor de p con coordenadas 
2/1, . . . ,y n , entonces podremos expresar 

dx ■ dx ■ 

dxi(p) = tt^O) dy x {p) H h tt^í») dy n (p). 

oyi oy n 

Al sustituir en el miembro derecho de (9.1) y desarrollar los productos exteriores 
obtenemos que los coeficientes Pi 1 --i k de uo en la carta Y se obtienen a partir 
de los coeficientes en X mediante sumas y productos por las derivadas parciales 
que aparecen en la igualdad anterior. De aquí se sigue que las funciones a^...^ 
son continuas, diferenciables o de clase C q en un punto dado si y sólo si lo son 
las funciones /3¿ 1 ...¿ fc (suponiendo que las cartas sean suficientemente derivables). 

Una forma diferencial de una variedad S es continua, diferenciable o de clase 
C q si y sólo si lo son sus coeficientes en todas las cartas. Por razones de simplici- 
dad en lo sucesivo sobreentenderemos que todas las variedades que consideremos 
tendrán cartas de clase C°° y por "forma diferencial" entenderemos "forma di- 
ferencial de clase C°°". En realidad todos los resultados que probemos valdrán 
igualmente sin más que suponer que las cartas y las funciones consideradas son 
suficientemente derivables, pero no entraremos en detalles al respecto. 

Si S es una variedad diferenciable, llamaremos A k (S) al conjunto de todas 
las formas diferenciales (de clase C°°) en S. Es claro que se trata de un espacio 
vectorial con las operaciones definidas puntualmente. Definimos el álgebra de 
Grassmann de S como la suma directa 

oo 

A(S) = 0A fe (S). 

k=0 
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El producto exterior de las álgebras A(T p (S)^ induce puntualmente un pro- 
ducto exterior en el álgebra de Grassmann, con el cual adquiere estructura de 
álgebra no conmutativa. Todas las propiedades del producto exterior que vimos 
en la sección anterior para álgebras exteriores valen trivialmente para álgebras 
de Grassmann. 

Tenemos que A°(S) es el conjunto de las funciones de clase C°° definidas 
sobre S. Si / € A°(S) ywe A(5) escribiremos fuj en lugar de / A w. Notemos 
que (fLü)(p) = f(p)Lü(p). 

Con la ayuda de estos conceptos podemos formular con precisión algunas de 
las ideas que exponíamos al comienzo de la sección anterior. Sea E un espacio 
vectorial euclídeo. Observemos que la n-forma dx\ A • • • A dx n asigna a cada 
paralelepípedo orientado F de E el determinante de las coordenadas de sus 
vectores en la base vi,...,v n . Si ésta es ortonormal y F no es degenerado 
entonces (dx\ A • • • A dx n )(F) es lo que llamábamos la medida orientada de F, 
es decir, la medida de P(F) salvo un signo, que será positivo o negativo según 
la orientación de F. 

Si la base vi,...,v n no es ortonormal (lo cual será lo más frecuente, pues 
las bases asociadas a cartas en espacios tangentes casi nunca lo son) entonces el 
volumen de F no vendrá dado por la n-forma básica, sino por un múltiplo suyo: 

dm = a dxi A • • • A dx n , 

donde a es el valor absoluto del determinante de la matriz de cambio de base 
entre una base ortonormal de i? y (v\, . . . ,v n ). A esta n-forma se le llama 
elemento de longitud, área, volumen, medida de E (según la dimensión). No- 
temos que si hacemos actuar los dos miembros de la igualdad anterior sobre la 
base (v\, . . . , v n ) vemos que a no es sino la medida del paralelepípedo que ésta 
determina. 

En el caso en que E es un espacio tangente T p (S) y la base fijada es la 
asociada a una carta X, el teorema 9.2 prueba de hecho que 

dm(p) = A x (p) dxxijp) A • • • A dx n (p). (9.2) 

En efecto, basta observar que Ax(p) es la medida de la imagen por dX(x) 
del paralelepípedo asociado a la base canónica, es decir, del paralelepípedo 
(DiX(x), . . . , D n X{x)) que hemos tomado como base en T p (S). 

Ahora nos encontramos con un inconveniente: nos gustaría definir el ele- 
mento de medida de una variedad S como la forma diferencial dm que a cada 
punto p le asigna la medida orientada de T P (S). Sin embargo esto es ambiguo, 
pues en T p (S) hay dos medidas orientadas — de signo opuesto — correspondien- 
tes a las dos orientaciones posibles del espacio. Más exactamente, si considera- 
mos la expresión (9.2) para dos cartas distintas X e Y alrededor de un punto p, 
las formas dm(p) correspondientes pueden ser iguales u opuestas según lo sean 
las orientaciones de las bases de T P (S) asociadas a las cartas. En otras palabras, 
depende de si dX(x) y dY(y) transforman la base canónica de IR™ en bases con 
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la misma orientación, y es fácil ver que esto equivale a que d(X o Y^ 1 )(x) con- 
serve la orientación, es decir, a que el determinante jacobiano de X o Y~ x sea 
positivo en x. 

Definición 9.14 Un atlas de una variedad S es un conjunto de cartas que 
cubran todos los puntos de S. Un atlas orientado es un atlas de S tal que si X e 
Y son dos de sus cartas y ambas cubren a un punto p, entonces el determinante 
jacobiano de X o Y^ 1 es positivo. Una variedad S es oríentable si admite un 
atlas orientado. 

De este modo, si fijamos un atlas orientado en una variedad S y tomamos 
p G T p (S), todas las bases de T p (S) inducidas por cartas del atlas tienen la 
misma orientación, a la que llamaremos orientación positiva de T p (S). En lo 
sucesivo, cuando hablemos de una variedad orientable se sobrentenderá que en 
ella hemos seleccionado un atlas orientado y por consiguiente una orientación 
positiva en cada espacio tangente. 

Ejemplo Toda variedad cubrible por una sola carta es orientable, conside- 
rando el atlas formado únicamente por dicha carta. En particular todo abierto 
de IR™ es una variedad orientable, tomando como carta la identidad. En lo su- 
cesivo consideraremos siempre esta orientación en los abiertos de R™, de modo 
que la base canónica será una base orientada de cada espacio tangente. ■ 

Teorema 9.15 Sea S una variedad orientable y X una carta de S con imagen 
conexa. Entonces, o bien las bases asociadas a X son todas positivas o bien son 
todas negativas. Según el caso diremos que la carta es positiva o negativa. 

Demostración: Sea U el dominio de X. Observamos que el conjunto de 
los puntos x € U tales que la orientación de la base de T X ( X ){S) es positiva es 
un abierto. En efecto, si x es uno de estos puntos e Y es una carta del atlas 
orientado alrededor de X(p), entonces el determinante jacobiano de X o Y^ 1 es 
positivo en x, luego es positivo en un entorno de x, y en todos los puntos de 
dicho entorno la base asociada a X será positiva. 

Similarmente se prueba que el conjunto de puntos x € U tales que la orien- 
tación de la base de T X ( X )(S) es negativa es un abierto. Como U es conexo, uno 
de los dos conjuntos es vacío. ■ 

Casi todas las variedades que hemos considerado como ejemplos concretos 
son orientables. Las únicas excepciones son la banda de Móbius, que describimos 
brevemente en el capítulo V y el *plano elíptico, que contiene una banda de 
Móbius. Se puede probar que toda variedad de dimensión 1 es orientable. Es 
fácil ver que también lo es toda superficie de revolución, todo producto de 
variedades orientables (tomando como cartas positivas los productos de cartas 
positivas) así como la esfera, lo cual se deduce fácilmente a partir del teorema 
siguiente: 

Teorema 9.16 Una variedad S C M m de dimensión m — 1 es orientable si y 
sólo si existe una determinación continua n : S — > R m del vector normal a 
T p (S) en cada punto p € S. 
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DEMOSTRACIÓN: Si S es orientable y p <E S definimos n(p) como el único 
vector unitario tal que si X es una carta positiva alrededor de p la base de 
W n formada por (n(p), D\X(xq), . . . , D m _iX(xo)) es positiva, donde x 0 es el 
vector de coordenadas de p. Es claro que n(p) no depende de la elección de X. 
Veamos que n es diferenciable en un entorno de p, para lo cual probaremos que 
Iones diferenciable en un entorno de x 0 - Consideremos un vector de inde- 
terminadas ñ — (yi, . . . ,y m ) € R m y las siguientes m ecuaciones con variables 

ñDiX = 0, . . . , ñZ) TO _iX = 0, ||ñ|| 2 = 1. 

Admitiendo que X es de clase C 2 , el teorema de la función implícita nos da 
que en un entorno de x$ existe una función diferenciable ñ tal que ñ(x) — n(p) 
y ñ(x) es unitario y perpendicular a T X ( X )(S). En efecto, el determinante que 
ha de ser no nulo para ello está formado por los m — 1 vectores DíX(xq) y el 
vector 2n(p), que forman una base de M. m . 

Hemos de comprobar que ñ(x) = n(X(x)) para todo x en el dominio de ñ. 
Basta ver que el determinante cuyas filas son (ñ(x),D 1 X(x),...,D m _ 1 X(x)) 
es positivo en todo punto x, pero ciertamente es una función continua que no 
se anula y en xq es positivo, luego lo es en todos los puntos. 

Recíprocamente, si n es una determinación continua del vector normal a 
S, definimos las cartas positivas como aquellas cartas X tales que la base 
(n(X(x)), DiX(x), . . . , D m -iX(i)) es positiva en todo punto x. Por el mismo 
argumento que en la implicación anterior es claro que la orientación de di- 
cha base depende sólo de X. Si una carta X es negativa, entonces la carta 
X{— xi, x 2 , . . . , x m ^i) es positiva y cubre los mismos puntos, luego todo punto 
de S se puede cubrir por una carta positiva. Es claro que si X e Y son dos 
cartas positivas alrededor de un punto p, entonces sus base asociadas en T P (S) 
tienen la misma orientación, luego las cartas positivas forman realmente un atlas 
orientado de S. ■ 

La prueba del teorema anterior muestra que las determinaciones continuas 
del vector normal son de hecho diferenciables (si las cartas son de clase C k , la 
aplicación n es de clase C fe_1 ). 

Si una superficie encierra una región del espacio (una esfera, un cilindro, 
un toro, etc.) es costumbre tomar como orientación positiva la inducida por la 
determinación del vector normal que apunta hacia fuera. 

Definición 9.17 El elemento de medida de una variedad orientable S es la 
forma diferencial dm que a cada punto p € S le asigna la medida orientada 
en T p (S), entendiendo que los paralelepípedos positivamente orientados tienen 
medida positiva. Si X es una carta positiva alrededor de un punto p, el elemento 
de medida en p viene dado por la expresión (9.2), que prueba que efectivamente 
es una forma de clase C°° . 

Esto nos da una caracterización de las variedades orientables en términos de 
formas diferenciales: 
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Teorema 9.18 Una variedad diferencial S de dimensión n es orientable si y 
sólo si existe una n-forma lo € A n (S) tal que u{p) ^ 0 para todo p € S. 

DEMOSTRACIÓN: Si S es orientable, entonces el elemento de medida dm es 
una n-forma en S que no se anula. Si existe una forma lo que no se anula, basta 
tomar como cartas positivas a las cartas X tales que para todo punto p cubierto 
por X se cumpla 



Notemos que si una carta es negativa, la carta que resulta de cambiar el signo 
a una función coordenada resulta positiva, por lo que todo punto puede cubrirse 
con una carta positiva, es decir, las cartas positivas forman un atlas. Por otra 
parte, si X eY son dos cartas positivas alrededor de un punto p, tenemos que 

Lo(p) = a(p) dxi(p) A • • • A dx n (p) = b(p) dy^p) A • • • A dy n (p), 

donde a y b son funciones positivas. Por el teorema 9.12 resulta que ba^ 1 
es el determinante de la matriz de cambio de base entre DX\(jp), . . . ,DX n (p) 
y DYi(p), . . . ,DY n (p), luego éste es positivo y ambas bases tienen la misma 
orientación, luego las cartas positivas forman un atlas orientado. ■ 

Definición 9.19 Sea S una variedad orientable de dimensión n y sea lo una 
n-forma diferencial en S. Entonces lo = fdm, para cierta / € A°(5). Diremos 
que lo es integrable en un conjunto de Borel B C S si lo es / respecto a la medida 
de Lebesgue, y en tal caso definimos 



donde el segundo miembro se entiende como la integral de / respecto a la medida 
de Lebesgue de S. 

Observar que si consideramos la integral de u> como función de B, tenemos 
que cada n-forma integrable induce una medida signada en S. 

Definimos el soporte de una forma en S como la clausura del conjunto de 
puntos de S donde uj no es nula. Es claro que las n-formas continuas con soporte 
compacto son integrables. 

Conviene comprender el significado geométrico de la medida asociada a una 
n-forma lo en una variedad S de dimensión n: es claro que lo determina una 
medida en cada espacio T p (S), la única medida que sobre los paralepípedos 
actúa como Lo(p). Entonces, la medida que lo induce en S es la única medida 
que en un entorno de cada punto p se confunde con la medida correspondiente 
de T p (S), donde "se confunde" hay que entenderlo exactamente en el mismo 
sentido que al principio del capítulo. 

Continuemos con las propiedades de las integrales de formas: Es claro que 



lo(p) = a(p) dx\{p) A • • • A dx n (p), con a > 0. 




lo = f dm, 



/ (aw + (3lo') = a lo + ¡3 lo'. 
Jb Jb Jb 
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Observar que si B está cubierto por una carta positiva X, aplicando la 
fórmula (9.2) y el teorema 9.3 tenemos 

í f dxi A • • • A dx n = í —— dm = í (X o /) dx\ ■ ■ ■ dx n , (9.3) 
Jb Jb &x Jx-^ib] 

donde la última integral es una integral usual en R" respecto a la medida de 
Lebesgue. En la práctica, si expresamos / en función de las coordenadas res- 
pecto a X, los dos extremos de las igualdades anteriores se escriben igual (salvo 
por la supresión de los símbolos del producto exterior), con lo que la teoría que 
subyace en dicha igualdad se vuelve "trasparente" . El ejemplo siguiente ilustra 
lo que queremos decir: 



Ejemplo Sea S la esfera de centro 0 y radio 1 (con la orientación usual, es 
decir, de modo que las bases positivas induzcan el vector normal que apunta 
hacia fuera) . Sea B la semiesfera z>0y calculemos 

/ xydx A dy. 
Jb 

Para ello observamos que la carta de coordenadas (x,y), es decir, la carta 
X(x,y) = (x,y, y/l — x 2 — y 2 ) es positiva, pues 



Por consiguiente 



X x AX y = (^Ai) = \{x,y,z). 

\z z / z 

\ xydx Ady = / xy dxdy, 
Jb Jc 



donde C = {(x,y) £ R 2 \ x 2 + y 2 < 1}. Así pues (una vez hemos comprobado 
que la carta está bien orientada) el cálculo de la integral se reduce a considerar 
que xy no es la función que a cada punto de S le asigna el producto de sus 
coordenadas, sino simplemente la función xy en R 2 , y que éstas varían en el 
conjunto en el que varían las coordenadas de los puntos de la semiesfera, es 
decir, en el disco unitario. ■ 

Ejemplo Sea de nuevo S la esfera unidad. Veamos que 

dx Ady = 0. 



Llamemos B + y B a las semiesferas z > 0 y z < 1. Teniendo en cuenta 
que el ecuador tiene medida nula, podemos escribir 

dx Ady = I dx Ady + I dx A dy. 
Js Jb+ Jb- 

Razonando como en el ejemplo anterior concluimos que la primera integral 
vale 7r, el área del disco unitario de R 2 . Para calcular la integral en la otra 
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semiesfera no podemos usar la carta X(x,y) = (x,y, — y / l—x 2 — y 2 ) porque 
es negativa. En su lugar usamos X(y,x) = (x,y, — \J\ — x 2 — y 2 ) , con lo que 

/ dx Ady = dy Adx = dydx = —ir, 

Jb- Jb- Jc 

luego la integral total es nula. ■ 

Para trabajar teóricamente con transformaciones de integrales del estilo de 
las que hemos empleado en los ejemplos anteriores conviene introducir un nuevo 
concepto. 

Teorema 9.20 Sea f : S — > T una aplicación diferenciable entre variedades. 
Entonces f induce un homomorfismo de álgebras /" : A(T) — > A(5) que a cada 
u) € A k (T) le asigna la k-forma dada por 

/«M(p)(«i, ...,«*)= w(/(p)) (# (p)(«i), df(p)(v k )). 

Demostración: Se comprueba inmediatamente que /" (u) (p) <G A k (T p (S)), 
con lo que /" es una aplicación de A(T) en el álgebra de todas las formas de 
S (no necesariamente diferenciables) . Así mismo es claro que /" es lineal y, a 
partir de la definición del producto exterior, se comprueba también sin dificultad 
que A J) = ft(u) A /*V). 

Para probar que ft(u>) es diferenciable en un punto p tomamos una carta 
X : U — > V alrededor de p y una carta Y : U' — > V alrededor de f(p). 
Podemos suponer que f[V] C V. Basta ver que ft(u>)\v es diferenciable en p, 
pero como la definición de /" depende sólo de los valores que toma / alrededor 
de p, dicha restricción coincide con (/|v p )"(w|v)- resumen, que podemos 
suponer que S y T son simplemente V y V. 

En tal caso, las diferenciales dy¿ junto con las 0-formas generan toda el 
álgebra de Grassmann, luego basta probar que /"(dy¿) y /*(<?) con g £ A°(T) 
son diferenciables. Esto es evidente: por la propia definición /* (dy») = d(f o y¿) 

yfHg) = f°g- ■ 

Una simple comprobación nos da que (/oj)' = g" o Si / es la identi- 
dad en una variedad S, entonces /" es la identidad en A(S), luego si / es un 
difeomorfismo también lo es /" y (Z") -1 = 

La aplicación /" recibe el nombre de retracción asociada a /. 

Cuando se emplea la notación adecuada, las retracciones resultan "invisibles" 
en la práctica. Por ejemplo, la retracción de la inclusión i : S — > T entre dos 
variedades es i"(w)(p) = u)(p)\ Tp (s) k i donde uo € A k (T). En muchas ocasiones 
hemos usado la notación dxi para deferirnos tanto a la diferencial en W 1 de la 
proyección ir¿ en la ¿-ésima componente como para referirnos a la diferencial 
de la restricción de x¿ a una variedad S. Ahora vemos que dicha restricción es 
í^(xí) y que la diferencial de la restricción es ${dxi). 

Otro ejemplo nos lo proporciona la fórmula (9.3), que hemos usado para 
calcular integrales en variedades. En términos de retracciones se escribe como 

f w = í A»H, 
Jb jx-'[b] 
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donde X es un carta de una variedad y B es un conjunto de Borel en su rango. 

En efecto, notemos que las Xi del segundo miembro de (9.3) son en realidad 
X o xí (si entendemos que las Xi son, como en el primer miembro, las coordena- 
das de X en la variedad), luego dxi(u)(v) es en realidad dXi(X(u))(dX(v)), es 
decir, las diferenciales dxi que aparecen en el segundo miembro son en realidad 
X$(dxí), si entendemos dxi como en el primer miembro. 

Con rigor deberíamos escribir donde i es la inclusión del rango de 

X en la variedad. Usando particiones de la unidad podemos probar un resultado 
más general, pero primero necesitamos justificar que las particiones se pueden 
tomar de clase C°° . Ello se debe al teorema siguiente, que es la versión del 
Lema de Urysohn para funciones de clase C°°. Recordemos que la notación 
K -< f -< V en un espacio S significa que / : S — > [0, 1] es una aplicación 
continua que vale 1 en K y se anula fuera de V. En lo sucesivo S será una 
variedad y K ~< f -< V supondrá también que / es de clase C°° . 

Teorema 9.21 Sea S una variedad diferenciable, sea K un subconjunto com- 
pacto de S y sea V un abierto de modo que K C V . Entonces existe f £ A°(S) 
tal que K -< f -< V ". 

DEMOSTRACIÓN: Probamos primero que dados números reales 0 < a < b 
existe g:R n — > [0, 1] de clase C°° tal que 

, s f 0 si \\x\\ < a, 

■ 9 ^ = {i si ¡ni > b. 

La construcción es sencilla a partir del teorema 3.32. En efecto, según dicho 
teorema existe una función / : IR — > IR de clase C°° que es nula fuera del 
intervalo ]a 2 , b 2 [ y positiva en su interior. Sea M = J a2 f(t) dt > 0. Definimos 

Así, M(p(u) es una primitiva de /, luego es de clase C°° en IR y cfi también. 
Como / es mayor o igual que 0 es claro que (f) es creciente. También es obvio 
que 

, / \ JO si u < a 2 , 
* (tt) = \l sini^. 

Ahora basta tomar g(x) = 1 — </>(||;r|| 2 ). 

Sea ahora p e K. Tomamos una carta X p : U — > W C S que cubra a 
p, donde U es un abierto en IR". Podemos suponer que 0 € U, X p (0) = p 
y W C V. Sea b p > 0 tal que B¡, (0) C U. Sea a p = b p /2. Componiendo 
X^ 1 con la función que nos da la construcción anterior obtenemos una función 
g p : W — > [0, 1] de clase C°° en W tal que g p vale 1 en un entorno de p en 
S (concretamente en X p [B ap (0)]) y se anula fuera de X p [B bp (0)]. Es claro que 
podemos extenderla a una función g p : S — > [0, 1] de clase C°° sin más que 
hacer g p (q) — 0 para todo q G S \ W. En particular g p se anula fuera de V. 
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Hemos dicho que g p vale 1 en un entorno de p. Estos entornos cubren K, 
luego por compacidad podemos extraer un subcubrimiento finito, con lo que 
tenemos k abiertos W\, . . . , Wk que cubren K y k funciones <?¿ : S — > [0, 1] de 
clase C°° de modo que se anulan fuera de V y gi | w¿ = 1 • 

Ahora basta tomar f(q) = 1 — (1 — gi{q)) ■■■(! — gk{q))- ■ 

Notemos que el teorema 7.27 es válido para variedades diferenciables, pues 
éstas son localmente compactas y además, si en lugar de usar en la prueba 
el Lema de Urysohn usamos el teorema 9.21, resulta que las particiones de la 
unidad las podemos tomar de clase C°°, tal y como pretendíamos. Ahora ya 
podemos probar: 

Teorema 9.22 Sea f : S — > T un difeomorfismo entre variedades orientables 
de dimensión n y uj una n-forma en T con soporte compacto. Entonces 

f <*= I /"(")■ 

J T J S 

DEMOSTRACIÓN: Cubrimos el soporte de ui con un número finito de rangos 
de cartas. Tomamos una partición de la unidad h\,...,h r subordinada a tales 
abiertos, es decir, h\ + - ■ ■ h r = 1 sobre los puntos del soporte dewy cada /i¿ tiene 
su soporte contenido en el rango de una carta. Entonces uj — h\ui + • • • + h r w 
y basta probar el teorema para cada forma hito. Equivalentemente, podemos 
suponer que el soporte de u¡ está contenido en el rango V de una carta X de 
T. Entonces Y = X o / _1 es una carta de S y es fácil ver que el soporte de 
ft(u>) está contenido en su rango. Según los comentarios previos al teorema, las 
integrales de la igualdad que queremos probar coinciden respectivamente con 
las de las formas Y^(p(ui)) y X^(u>), definidas sobre el dominio (común) de las 
dos cartas. Es claro que ambas formas son la misma. ■ 

Veamos otro ejemplo de "invisibilidad" de las retracciones: Si S\ y 5*2 son 
dos variedades diferenciables, la retracción de la proyección 7r¿ : Si x S2 — > Si 
es un homomorfismo irj : A(S¿) — > A (Si x S2). 

Supongamos que S\ y S2 son los rangos de las cartas X\ y X 2 , de coordenadas 
¡Ti, ... , x ni e 2/1, . . . , y n2 . Entonces las funciones coordenadas de X\ x Xi son 
las 7i"i o xí y 7T2 o yi, que en la práctica podemos llamar también x¡ e pero 
que con rigor son 71"' (¡r¿) y n^iyi). 

Notemos que diTi(pi,p2) ■ T Pl (Si) x T P2 (S2) — > T Pi (Si) es simplemente la 
proyección. Teniendo esto en cuenta es fácil ver que dxi, considerada como 
forma en S\ x S2, no es sino la retracción 7r{((¿r¿), donde ahora dxi es la forma 
de Si. Así pues, la retracción de una forma arbitraria de Si expresada en 
términos de las coordenadas de A¿ es la forma que tiene la misma expresión 
pero interpretando las coordenadas y las diferenciales en el producto. 

Más en general, es fácil ver que si una k- forma uj (digamos de S 1 ) no se 
anula en un punto p, entonces ir{ (uj) no se anula en los puntos de la forma (p, q) 
y análogamente para i = 2, con lo que las retracciones wj son monomorfimos de 
álgebras y podemos identificar las formas de Si y S2 con formas de S\ x 6*2 . 
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Por ejemplo, con estas identificaciones tenemos que dm = dm\ A drri2, donde 
dm, dmi y dmi son los elementos de medida de S1XS2, Si y S2 respectivamente. 
En efecto, una carta X\ x A 2 alrededor de un punto (p, q) de coordenadas 
(x, y) induce la base de T( Pjí )(S'i x S2) formada por los vectores (£>¿Xl (x) , 0) y 
(0,DiX 2 (y)). Además 

Ui = d7n(p,g)(A^i(a;),0) = A*i(a:), d7n(p,g)(0, DiX 2 (y)) = 0, 

Vi = dir 2 (p,q)(p,DiX2(y)) = DiX 2 (y), dn 2 ( P ,q)(D l Xi(x),0) = 0, 

luego, al calcular Tr{(dmi)(p) f\ir\(dm,2){q) sobre esta base mediante la definición 
de producto exterior, se anulan todos los sumandos correspondientes a permu- 
taciones que hacen actuar a 7rJ(dmi)(p) sobre una vector de X 2 y viceversa. Por 
consiguiente queda 

^ Slg ( a ' y dmi(u CT(1) , . . . , u a(ni) ) dm 2 {v T (i), . . .,v T(n2) ), 

Til .Tío ■ 

(a,T)eS ni xS„ 2 

que claramente es igual a 

drmipjim, . . . ,u ni )dm2(q)(vi, . . . ,v„ 2 ) = A Xl (p)Ax 2 (q) = A Xl xx 2 (p,q)- 

Por otra parte es inmediato que éste es el valor que toma dm(p, q) sobre la 
misma base, luego ambas formas coinciden. ■ 



Ejemplo La aplicación / : ]0,+oo[ x S"" -1 — > IR™ \ {0} dada por f(r,x) = 
rx es un difeomorfismo. Tomemos una carta X de S*™ -1 (de coordenadas 
Xi, . . . , x n -i) y la identidad como carta de ]0, +oo[ (con coordenada r). En- 
tonces Y = (I x X) o / es una carta de R n \ {0}. Más detalladamente: 
y(r,xi,...,a; n _i) = rX(x 1 , . . . ,a; n _i). 

De este modo, cada punto del rango de JxX tiene las mismas coordenadas 
que su imagen por / y la retracción /" de una forma de W 1 \ {0} expresada 
en términos de r, xi, . . . , x n -i, y sus diferenciales es la forma con la misma 
expresión pero interpretada como forma de ]0, +00 [ x S*™ -1 . 

En estas coordenadas, el elemento de medida en M™ \ {0} es 



dm 



X 1 



X n D\X n 



D n -\X\ 



D n -\X n 



dr A dx\ A • • • A dx n _i. 



La retracción /"(dm) viene dada por esta misma expresión. El determinante 
es la medida del paralelepípedo formado por los vectores X, Di X, ... , D n _iX. 
Como X es unitario y perpendicular a los otros vectores, es claro que dicha 
medida es también la medida n — 1-dimensional del paralelepípedo determinado 
por los vectores DiX, . . . , D n _iX. Así pues, 

f\dm) =r n - 1 drAda, 
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donde da es el elemento de medida de Hemos probado esta relación para 

los puntos de ]0, +oo[ x S*" -1 cubiertos por la carta que hemos tomado, pero 
como ésta era arbitraria, la igualdad vale para todo punto. Por otro lado dr Ada 
es el elemento de medida de ]0, +00 [ x S 1 ™ -1 . 

Con esto hemos probado en general que si h es una función integrable en 
R n , entonces 

/ h(r,x 1 ,...,x n - 1 )dm= h(r, Xi, . . . , x n _i)r" _1 dm 

= J (^J ^ h(r,x 1 ,...,x n ^ 1 )r n ~ 1 daj dr. 

De aquí se sigue que si identificamos W l con ]0, +oo[ x S 11 ^ 1 entonces la 
medida de Lebesgue se identifica con el producto de la medida dada por r" _1 dr 
y la medida de Lebesgue en S" 1-1 . En particular, podemos aplicar el teorema de 
Fubini, que nos asegura que si h es positiva y existe la integral doble del miembro 
derecho, entonces h es integrable en IR". En otras palabras, las funciones pueden 
integrarse "por capas" . ■ 

Veamos un par de aplicaciones: 

Teorema 9.23 La función l/||x|| Q es integrable en un entorno de 0 en W 1 si y 
sólo si a < n. 

DEMOSTRACIÓN: Con la notación del ejemplo anterior: 
/ j-^-dm= í r- a r n - 1 dm = m(S n - 1 ) f V"" 1 "" dr. 

JD(e,R) \\ x \r J]e,ñ[xS"-i Je 

Si a < n, una primitiva del integrando de la derecha es r n ~ a /(n — a) y 
podemos concluir que 

1 Tyn—a 



I B ¥¥ dm = m{sn ~ 1) 



n — a 

Es fácil ver que si a > n el miembro derecho tiende a 00 cuando e tiende a 0. 



Ejemplo Sea a n la medida de Lebesgue de S n . Vamos a calcularla. Para ello 
consideremos la función g(x) = e II ^ II , definida en IR n+1 . Calculamos de dos 
formas su integral. Por una parte (ver el final del capítulo anterior) 



/ g(x) dm = ( je ^ dt 



n+l 



= „.(n+l)/2_ 



Por otra parte la integral se puede calcular como 

p+00 z'+oo 



/ / r n e- r2 drda=^ ^-^-1/2 dt = ^ n( ÜZLÍ). 

Js n Jo 2 J 0 2 2 
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Por consiguiente 

_ 2^(" +1 >/ 2 _ (n + l)7r(" +1 )/ 2 

En el capítulo anterior obtuvimos una expresión para la medida de Le- 
besgue de la bola unidad en términos de la función factorial. También po- 
demos deducirla de la expresión anterior, pues a través de la identificación 
R" = ]0, +00 [ x S" 1-1 la bola unidad se identifica con ]0, 1[ x S*™ -1 y su medida 
de Lebesgue es el producto de la medida r™ -1 dr por la medida de Lebesgue en 
la esfera. La medida del intervalo es 

el 



I 

Jo 



r n ~ 1 dr= -. 



'o 

luego la medida de la bola es 

V n = 



l/2 



n n(n/2) : 
como ya sabíamos. 



9.4 Algunos conceptos del cálculo vectorial 

En esta sección introduciremos algunos conceptos que ilustren las aplicacio- 
nes de las formas diferenciales. Comenzamos con la integral curvilínea y sus 
aplicaciones. Sea 7 : [a, b] — > R™ un arco regular. Si 7 no se corta a sí mismo 
(sin excluir que sus extremos coincidan) podemos considerar a su imagen como 
una 1-variedad con 7 como única carta y dotada de la orientación ésta le in- 
duce. Sea F : j[a,b] — > R™ un campo continuo de vectores. A este campo le 
asociamos la 1-forma en 7 dada por 

F dr — Fi dx\ H h F n dx n , 

que formalmente puede interpretarse como el producto escalar de F por el vector 
dr = (dx\, . . . , dx n ). De hecho, la forma asigna a cada vector v £ ^(7) el 
producto escalar F(p)v. Esto implica que F dr sólo depende de la proyección 
de F sobre la recta tangente a 7 en cada punto. En particular, si F es el vector 
tangente unitario T entonces (T df)(v) — ±||f||, la longitud orientada de v, 
es decir, T dr — ds. En general podemos descomponer F = aT + N, donde 
T y N son ortogonales. Multiplicando por T vemos que a = FT. Así pues 
Fdf= (FT)Tdf= FT ds. 

Se define la circulación o integral curvilínea de F a través de 7 como la 
integral 

/ Fdr = f FT ds = f (F^t))^) + ■ ■ ■ + f n ( 7 (t))Y n (*))dí 

J 7 J7 Ja 

h F(7(í)) 7 '(í)dí. 




9.4. Algunos conceptos del cálculo vectorial 



347 



Observemos que F df es en principio una forma continua, no necesariamente 
diferenciable, pero nuestra definición de integral vale igualmente en este caso. 
Notemos también que la última integral tiene sentido aunque 7 se corte a sí 
misma, por lo que la noción de integral curvilínea es ligeramente más general. 
En la práctica conviene considerar incluso el caso en que 7 es derivable salvo en 
un número finito de puntos, lo cual tampoco afecta a la integral. 

Definición 9.24 Un arco singular es una aplicación continua <¡> : [a, b) — > R™ 
tal que existe una partición a = to < íi < • • • < t n = b de modo que 0|[t i ,í¿ +1 ] es 
de clase C 1 (en el sentido de que se extiende a una función de clase C 1 en un 
abierto que contiene a [í,,í¿+i]). 

Observar que no exigimos que la derivada no se anule. Si F : <¡>[a, b] — > R™ 
tenemos definida la integral curvilínea de F sobre 4> mediante 



r n rU 

Fdr = Y, F(4>(t))4/(t)dt. 
J 4> ¿—i Jti-i 



(0uv)(í) 



Si <¡> : [a, b] — > IR™ y ip : [c, d] — > R™ son dos arcos singulares tales que 
4>{b) — ip(c), definimos su unión como el arco <f> U ip : [a, b + d — c] — > IR™ dado 
por 

( 4>{t) si a < t < b 

\i>(t-b + c) si b<t<b+d-c 

Claramente (j)Uip es el arco que resulta de recorrer (j> y seguidamente recorrer 
ip. Observemos que aunque <¡) y i¡) fueran derivables en todo su dominio, su unión 
no tiene por qué serlo en el punto de enlace. Esta es una de las razones por las 
que conviene trabajar con arcos derivables a trozos. 

Dado un arco singular <¡> : [a,b] — > IR™, definimos su inverso como el arco 
— (j) : [—6, —a] — > IR™ dado por (— (¡>)(t) = </>(— i). Se trata del arco que recorre 
la misma trayectoria pero en sentido inverso. 

Las propiedades siguientes son inmediatas: 

/ Fdr= ¡ Fdf+ / Fdr, / F dr = - / Fdf. 

J(pUip J<¡> Jip J—<¡> J<j> 

En este contexto, el segmento que une dos puntos x, y G IR™ es el arco dado 
por [x, y](t) = (1 — t)x + ty, para 0 < t < 1. Una poligonal es una unión finita 
de segmentos. Un arco <f) : [a,b] — > IR" es cerrado si <¡>{a) = 4>{b). 

La interpretación más importante de la circulación de un campo a lo largo 
de una trayectoria proviene de la física: 



Ejemplo Supongamos que 7(í) es la posición en cada instante t de un móvil 
de masa m, de modo que cuando se encuentra en la posición p la fuerza total que 
actúa sobre él es F(p). La circulación W de F a través de 7 recibe el nombre 
de trabajo realizado por F sobre el móvil. Para entender el significado físico 
del trabajo observemos en primer lugar que éste depende únicamente de de la 
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componente tangencial de F, que será de la forma F t = maT, donde T es el 
vector tangente unitario de 7 y a es la derivada del módulo v de la velocidad 
del móvil. Así 

dW — F df = maT df = ma ds = mav dt = mv dv. 

Nos gustaría integrar ambos miembros, pero para ello necesitaríamos consi- 
derar a v como variable independiente, lo que equivale a tomarla como parámetro 
de 7 y esto no siempre será posible. Pese a ello, el resultado que se obtiene de 
integrar formalmente la igualdad anterior es correcto. Para probarlo definimos 



2 



E = \miv 
Entonces 

dE dW(t) 
— — = mva = — : — , 
dt dt 

donde W(t) representa a la circulación de F en el intervalo [a,t]. De aquí se 
sigue que 

W = W(b) = AE = E(b) - E(a). 

La magnitud E recibe el nombre de energía cinética del móvil, y lo que 
hemos probado es que el trabajo que ejerce una fuerza sobre un móvil es igual 
al incremento de la energía cinética que éste experimenta bajo su influencia. 
Notar que podemos definir el trabajo realizado por cualquier fuerza sobre un 
móvil dado, no necesariamente la fuerza total que actúa sobre él. Entonces el 
trabajo realizado por una suma de fuerzas es la suma de los trabajos realizados 
por cada una de ellas. El trabajo y la energía se miden en Julios. Un Julio es 
el trabajo que realiza una fuerza de un Newton cuando actúa tangencialmente 
sobre un móvil que recorre una trayectoria de un metro. ■ 

Existe una versión de la regla de Barrow para integrales curvilíneas. 

Teorema 9.25 Sea f : U — > R una aplicación de clase C 2 en un abierto U de 
R n y sea 7 : [a, b] — > U es un arco de extremos p = 7(0) y q = j(b). Entonces 



'7 

Demostración: Observemos que 



/ df = f(q) - f(p). 



df = — dxi H h „ — dx n = V/ df. 



Entonces 



í df = f V.fdf= í í> V/(7(í))7'(í)dí 

J 7 J 7 Ja 

= [ d ^/ 1 dt = /( 7 (6)) - /(7(«)) = f(q) fip). 
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(Si hay puntos donde 7 no es derivable se razona separadamente en cada 
intervalo donde sí lo es y se llega a la misma conclusión) . ■ 

Vemos así que cuando integramos un campo de la forma V/ sobre un arco, 
la integral sólo depende de los extremos del mismo. Este hecho tiene gran 
importancia: 

Definición 9.26 Diremos que un campo F : U C K" — > IR™ definido en un 
abierto U es conservativo si la circulación de F a lo largo de cualquier arco 
singular contenido en U depende únicamente de sus extremos. 

Hay que entender que en la dependencia de los extremos se incluye el orden 
de los mismos, pues 7 y —7 tienen los mismos extremos, pero las integrales 
respectivas son opuestas. Notar que si <f> y tp son arcos con los mismos extremos, 
la condición 



es equivalente a 




Es claro entonces que un campo F es conservativo si y sólo si las integrales de 
F a lo largo de los arcos cerrados son todas nulas. 

El teorema anterior prueba que los campos de gradientes, es decir, los campos 
de la forma F = V/, donde / es una función de clase C 2 , son conservativos. 
Ahora probamos que éstos son los únicos campos conservativos: 

Teorema 9.27 Un campo F : U — > K™ de clase C 1 en un abierto U C R n es 
conservativo si y sólo si existe una función V : U — > R tal que F = VV. Si U 
es conexo, la función V está determinada salvo una constante. 

Demostración: Ya sabemos que los campos de gradientes son conservati- 
vos. Supongamos que F es un campo conservativo. No perdemos generalidad si 
suponemos que U es conexo. Entonces es conexo por poligonales. Fijamos un 
punto xq € U y para cada x G U existe una poligonal <f> x : [a, b] — > U tal que 
<t>x(o) — xq y <l>x(b) — x. Definimos 

V(x) = í Fdr. 

Como F es conservativo, V(x) no depende de la elección de la poligonal. Veamos 
que W = F, lo que en particular probará que V es una función de clase C 2 . 

Tomemos x € V y sea e¿ el ¿-ésimo vector de la base canónica de IR™ . Sea <fi x 
una poligonal que una xq con x y consideremos la poligonal <¡> x U [x,x+hei], que 
une x 0 con x + he^ donde h ^ 0 es suficientemente pequeño para que x + hei 
esté en U. Entonces 

V(x + he t ) -V(x) 1 f „ 1 f 1 „. , , 

— ^ — = - / Fdf=- F(x + thei)heidt 

h h J[ XyX+ he z ] h Jo 

1 

Fi(x + thei) dt 
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La función _F¿ es uniformemente continua en el segmento [x — h 0 ei, x + /io e ¿]> 
para un h 0 fijo. Por lo tanto, dado e > 0, existe un S > 0 tal que si \h\ < S y 
0 < t < 1 entonces + //ie¿) — i*¿(ar)| < e/2. Por consiguiente 



V(a; + fte¿) - V(x) 



h 



- Fi(x) 



[ (Fi(x + thei) - Fí(x)) dt 
Jo 



< 



Jo 



+ thei) - Fi(x)\ dt < 



s: 



dt < e. 



Esto prueba que existe 



dV 

dxi 



(x) = Fi(x). 



La unicidad de V es clara: si Vi y V¿ cumplen el teorema entonces Vi — V2 
es una función de clase C 1 con gradiente nulo, luego su diferencial es nula y (si 
U es conexo) Vi — V¿ es constante. ■ 

Si un campo es de la forma F — W, se dice que la función V es una función 
potencial para F. Según hemos calculado, la circulación de F a lo largo de un 
arco singular es la diferencia de potencial entre sus extremos. De nuevo la física 
nos proporciona ejemplos de esta situación: 



Ejemplo El campo gravitatorio que produce una masa puntual es conser- 
vativo. Recordemos que si el cuerpo tiene masa M y elegimos el sistema de 
referencia de modo que sus coordenadas sean nulas, la fuerza que éste ejerce 
sobre un cuerpo de masa m situado en la posición x es 

GMm 

F = - „ „„ x. 

\\ x \\ 

Puesto que la fuerza depende sólo de p — ||x|| lo mismo ha de suceder con 
el potencial. Si planteamos el problema en una variable (y x > 0) la solución 
es simple: buscamos una función cuya derivada sea —GMm/x 2 , luego nos sirve 
GMm/x. En tres dimensiones la solución es 

GMm 

Si un cuerpo de masa m se encuentra en la posición x, definimos su energía 
potencial respecto a la masa M como 

GMm 



Añadimos el signo negativo de modo que si el cuerpo se desplaza desde un 
punto x hasta un punto y por cualquier trayectoria, el trabajo que sobre él 
realiza el campo gravitatorio de M es —AE P = ~( y E p {y) — E p (x)). Si el cuerpo 



9.4. Algunos conceptos del cálculo vectorial 



351 



se mueve sobre una trayectoria 7 y sobre él actúa otra fuerza F distinta de la 
gravitatoria, el trabajo total realizado sobre él es 



Fdr-AE p . 



Según hemos visto antes, este trabajo es igual al incremento de la energía 
cinética del cuerpo AE C . Si llamamos energía total del cuerpo a E = E p + E c 
concluimos que 



AE = AE P + AE C = / Ft 



W. 

'7 

En resumen: el trabajo realizado sobre un cuerpo por las fuerzas distintas 
del campo es igual al incremento de la energía total del cuerpo. En particular, 
si un cuerpo se mueve sometido únicamente a la acción del campo su energía 
total permanece constante. 

Toda la teoría se desarrolla más cómodamente sin particularizar a un cuerpo 
ra en concreto. Para ello se definen el vector intensidad de campo y el potencial 
gravitatorio como 

GM GM 
E=-—-=x, 1/=-— — , 



respectivamente, de modo que la fuerza gravitatoria que actúa sobre un cuerpo 
de masa m es mE y la energía potencial de un cuerpo de masa m es mV. La 
relación entre ambos es E = — VV. 

Retomemos los cálculos que hicimos en el capítulo VI sobre un cuerpo que 
sigue una trayectoria cónica sometido a la fuerza gravitatoria. Puesto que los 
sumandos de (6.1) son ortogonales deducimos que el cuadrado del módulo de la 
velocidad es 

2 12 1 2 2 
v = p + p uj . 

(Notemos que en el capítulo VI llamábamos v al vector velocidad y aquí a su 
módulo) . La energía total del móvil será 

^ ^ n 1 / 10 ? ?n GMm 

E = E C + E p = -m(p' 2 + p 2 tü 2 ) . 

¿ p 

Por otro lado la ecuación de la trayectoria es 

L 2 1 

P = 



GMm 2 1 + ecos 6 



donde e es la excentricidad de la cónica. Puesto que la energía total es constante, 
podemos calcularla en el punto que nos resulte más conveniente. Por ejemplo 
cuando 8 = 0, que corresponde con el valor mínimo de p, luego p' = 0. Entonces 

P 1 2 2 L 2 G 2 M 2 m 3 M , 2 ^ G 2 M 2 m 3 . 
E c =- mp W= — = -^(l + e) 2 , E p = ^— (1 + e), 

luego 

„ G 2 M 2 m 3 , N2 n/i , \ 
E= 2L2 ((l + e) 2 -2(l + 6)), 
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y, en definitiva, la energía del móvil es 

Notamos que la trayectoria es elíptica, parabólica o hiperbólica según si 
£<0,B = 0o£;>0. ■ 

Ejemplo Veamos otra interpretación de la circulación de un campo, ahora en 
el contexto de la hidrodinámica. Supongamos que V es el campo de velocidades 
de un fluido. Esto significa que si liberamos una partícula de masa despreciable 
en un punto p el fluido la arrastrará con velocidad V(p) (no excluimos que V 
pueda depender del tiempo además de hacerlo de la posición). Supongamos 
ahora que en el fluido situamos una bolita sujeta por una varilla rígida a un eje, 
respecto al cual puede girar a lo largo de una circunferencia de radio r? Es claro 
que si la bolita se encuentra en el punto p el fluido la hará moverse con velocidad 
igual a la proyección de V(p) sobre la recta tangente a la circunferencia en p, 
pues la componente normal de la velocidad será cancelada por las fuerzas que 
mantienen rígida a la varilla que sujeta la bola. 

Imaginemos ahora que el eje sujeta a la varilla por 
el centro y que ésta tiene una bolita en cada brazo. 
Si éstas se encuentran en los puntos p\ y p 2 , enton- 
ces su velocidad (que en módulo ha de ser la misma 
para ambas a causa de la rigidez de la varilla) estará 
determinada por los vectores V(pi) y V(p 2 )- Al igual 
que en el caso anterior en realidad dependerá sólo de las proyecciones V(pi) y 
V(p 2 ) de dichos vectores sobre las rectas tangentes respectivas. Por ejemplo, en 
el caso indicado en la figura, donde ||V"(pi)|| — 2 y ||V"(p2)|| = 1, la velocidad 
resultante será el promedio 3 de ambas: la varilla girará en sentido contrario a 
las agujas del reloj con velocidad (2 — l)/2 = 1/2. 

Supongamos ahora que en vez de una varilla tenemos un molinillo con n 
aspas. Entonces el módulo de la velocidad resultante será 

±V( Pl )T( Pl ) + ■ ■ ■ + - V( Pn )T( Pn ), 
n n 

donde T es el vector tangente a la circunferencia. Equivalentemente podemos 
escribir 

(—V( Pl )T( Pl ) + ■■■ + —V( Pn )T(p n ) 
2irr \ n n 




2 En esta clase de situaciones suponemos siempre que los objetos que introducimos son 
instrumentos de medida ideales, es decir, que son afectados por el fluido pero ellos no afectan 
al mismo. 

3 Se trata de un problema de conservación de la cantidad de movimiento. De hecho es 
equivalente al siguiente: dos cuerpos de la misma masa se aproximan frontalmente de modo 
que sus velocidades son v\ y V2- Si tras el choque se mueven conjuntamente, ¿a qué velocidad 
lo hacen? La respuesta es que la cantidad de movimiento del sistema es mv\ +rriV2 al principio 
y 2mv al final. Igualando resulta que v = (vi + t>2)/2. El fluido comunica una cantidad de 
movimiento a las bolitas y la varilla s limita a unificar las velocidades sin alterar la cantidad 
de movimiento. 
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donde r es el radio de la circunferencia. Esto equivale a considerar la circun- 
ferencia dividida en n partes iguales de longitud As = 2nr/n, multiplicar la 
longitud de cada parte por el valor de VT en uno de sus puntos, sumar y luego 
dividir el resultado entre la longitud completa de la circunferencia. Finalmente, 
si en lugar de un molinillo ponemos una ruedecita de radio r, la velocidad que 
le imprimirá el fluido vendrá dada por 

v= — í VTds=— ¡ Vdr. 
2nr J c 2irr J c 

La velocidad v corresponde a una velocidad angular lo = v/r. Así pues, 



üj 




Estudiemos ahora la noción de flujo de un campo a través de una variedad. 
A cada campo F : U C W n — > R m , donde U es un abierto en IR m , podemos 
asociarle la m — 1-forma 

m 

d$(F) = dxi A • • • A dx l _ 1 A dx i+1 A • • • A dx m . 

i=l 

Supongamos que S C U es una variedad orientable de dimensión m — 1, 
sea n la determinación del vector normal que induce su orientación, tomemos 
pe S y vi,... ,v m -i € T P (S). Vamos a probar que d$(F)(p)(vi, . . . ,v m -i) es 
el determinante de la matriz A cuyas filas son F(p),vi, . . . ,v m -i- En efecto, 
desarrollándolo por la primera fila tenemos que 

m 

detA = det A h 

¿=i 

donde A¿ es la matriz que tiene por filas a los vectores Vi, . . . , v m _i sin su ¿-ésima 
componente. Teniendo en cuenta el teorema 9.10 resulta que 

det Ai — dxi A • • • A A dx i+ \ A • • • A dx m (vi, . . . v m -i) 

y tenemos la relación buscada. Notemos que para este cálculo no necesitamos 
que F esté definido más que sobre los puntos de S. En particular podemos 
aplicarlo al vector normal n, pero entonces el determinante de la matriz cuyas 
filas son n(p), Vi, . . . , v m _i es la medida (orientada) del paralelepípedo determi- 
nado por estos vectores, y como n(p) es unitario y perpendicular a los restantes, 
es claro que coincide con la medida orientada de (vi, . . . ,v m -i) en T p (S). Así 
pues, si llamamos da al elemento de medida de S, hemos probado que 

m 

da(p) = ^^(— iy +1 rii(p)dxi A • • • A dx¿_i A dx i+í A • • • A dx m . 
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Volviendo al campo F, sobre los puntos de S podemos descomponerlo como 
F = (Fn)n+t, donde t G T p (S). Esto nos permite descomponer el determinante 
de A en dos términos, pero el sumando correspondiente a t es nulo (pues sus 
filas son m vectores de T p {S)), luego en definitiva 

^(-l^+VO)^! A • • • A dxi-t A dx i+1 A • • • A dx, 
¿=i 

es decir, d$(F) = (Fn) da. 

Ejercicio: En particular, si S es una superficie en R 3 tenemos que 

da = ni dy A dz + 712 dz A dx + nz dx A dy. 
Calcular a partir de aquí el área de la esfera. 

Definición 9.28 Sea F : U C M" 1 — > M m un campo de clase C 1 en un abierto 
[/ C R m . Se llama flujo de F a, través de una variedad orientable S C U de 
dimensión m — 1 a la integral 

donde n es el vector normal de S. 

En resumen, así como la circulación de un campo a través de una curva 
era la integral del módulo orientado de la componente tangencial del campo en 
cada punto de la curva, el flujo de un campo a través de una variedad es la 
integral del módulo orientado de su componente normal. La hidrodinámica nos 
proporciona una imagen más concreta del flujo de un campo. 

Ejemplo Supongamos que V es la velocidad de un fluido en cada punto. Sea 
S una superficie en el seno del fluido y p € S. Consideremos un entorno para- 
lelogramo (u,n) en T p (S) suficientemente pequeño como para que p + P(u,v) 
se confunda con un subconjunto de S. También podemos suponer que la ve- 
locidad del fluido en un entorno de p en R 3 que contiene al paralelogramo es 
aproximadamente igual a V(p). Nos preguntamos cuál es el volumen de fluido 
que atraviesa el paralelogramo por unidad de tiempo. 

Observamos que el fluido que en un instante 
dado se encuentra en el paralelogramo, al cabo 
de una unidad de tiempo se encontrará en otro 
paralelogramo similar trasladado del primero me- 
diante el vector V = V(p). El volumen de fluido 
que ha atravesado el paralelogramo será igual al 
volumen del paralelepípedo (u,v, V). Una simple 
aplicación del teorema de Fubini muestra que el volumen del paralelepípedo 
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es igual al área de su base multiplicada por su altura (medida perpendicu- 
larmente a la base), es decir, el volumen que atraviesa el paralelogramo es 
(Vn)(p)da(p)(u,v) = d$(V)(u,v), entendiendo que el volumen es positivo si 
el fluido atraviesa el paralelogramo en la dirección de n y negativo en caso 
contrario. 

La aplicación que a cada región de S le asigna el volumen de fluido que lo 
atraviesa es una medida en S que en un entorno de cada punto debe confundirse 
con d$(V). Por consiguiente dicho volumen es precisamente $>(V). 

Si en lugar de hablar de volúmenes queremos hablar de masa habremos de 
considerar la densidad p del fluido en cada punto, es decir, p es la derivada de 
la medida que a cada región del espacio le hace corresponder la masa de fluido 
que contiene, de modo que dicha masa se recupera integrando p en la región en 
cuestión. Si en lugar de trabajar con V trabajamos con el campo A = pV, el 
razonamiento anterior nos da claramente que la cantidad de masa que atraviesa 
una superficie S es el flujo de A a través de S. m 



Capítulo X 

El teorema de Stokes 



En el capítulo anterior hemos visto el teorema 9.25, que es la versión para 1- 
formas de la regla de Barrow. Existe una versión general del teorema de Barrow 
para n-formas, la cual constituye el último de los resultados fundamentales del 
cálculo integral de varias variables. Se trata del llamado teorema de Stokes 
generalizado, del que nos ocuparemos en este capítulo. Aunque todavía no 
tenemos definidos algunos de los conceptos que involucra, conviene anticipar su 
aspecto. Se trata de la fórmula: 



Aquí u es una n — 1-forma definida en una variedad S de dimensión n. En este 
capítulo extenderemos el concepto de diferencial — que hasta ahora sólo tenemos 
definido para 0-formas — de modo que la n — 1-forma uj tendrá asociada una 
n-forma div, que es la que aparece en el primer miembro de la fórmula anterior. 
También hemos de introducir el concepto de frontera de una variedad S. Por 
ejemplo, si S es una bola abierta en IR 3 , entonces dS será la esfera del mismo 
centro y el mismo radio (que es una variedad de una dimensión menos). El 
teorema de Stokes afirma en este caso que la integral de la forma dui sobre la 
bola puede obtenerse integrando oj sobre la esfera. 

Es importante que la noción de frontera de una variedad que vamos a intro- 
ducir no siempre coincide con la frontera topológica. Por ejemplo, si S es una 
semiesfera en R 3 , todos sus puntos son puntos frontera desde el punto de vista 
topológico, mientras que su frontera como variedad la formarán los puntos del 
ecuador, donde la superficie "termina" . 

10.1 Variedades con frontera 

Definición 10.1 Un semiespacio en R n es un subconjunto de la forma 

H = {x e M" | u(x) < a}, 
donde u : W l — > IR es una aplicación lineal yagl. 
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Obviamente H es cerrado en IR™ y su frontera topológica es 

dH = {x e R n | u(x) = a}. 

Cuando hablemos de un subespacio abierto U de un semiespacio H C IR™ 
entenderemos que U es abierto respecto a la topología de H, no necesariamente 
abierto en IR™. Llamaremos frontera de U al conjunto dU = U O dH. Es claro 
que dU es la intersección de U con su frontera en IR™, por lo que no depende de 
H. Además el conjunto U es abierto en IR™ si y sólo si dU = 0. Los puntos de 
U \ dU los llamaremos puntos interiores de U. Notemos que estos conceptos de 
interior y frontera no coinciden con los topológicos. 

Sea U un subespacio abierto de un semiespacio en IR™. Diremos que una 
aplicación / : U — > IR™ es diferenciable (de clase C k , etc.) en un punto p e U 
si existe un entorno abierto W de p en IR™ y una aplicación g : W — > R m 
diferenciable (de clase C k , etc.) en el sentido usual y de modo que g\wnu = f ■ 

Notemos que si p £ dU entonces podemos tomar W C U y la condición 
equivale a que / sea diferenciable (en el sentido usual) en un entorno de p, es 
decir, a que / sea diferenciable en p en el sentido usual. 

Si / : U — > V es un difeomorfismo de clase C 1 entre subespacios abiertos de 
semiespacios de IR™, entonces f[dU] = dV. En efecto, si p ^ dU existe W C U 
entorno abierto de p en R™ tal que f\w es diferenciable en el sentido usual, luego 
f[W]cV es abierto en IR™, luego f(p) i dV. 

Sea / : U — > IR" 1 una aplicación de clase C 1 definida en un subespacio 
abierto de un semiespacio y p G dU . Para ¿ = 1,2 sea g¿ : Wi — > IR" 1 una 
extensión de clase C 1 tal que W¿ es abierto en IR™ y g¿|vF¡n¡7 = /• Entonces 
dgi(p) = dg2 (p). En efecto, la aplicación g = gi — 52 es de clase C 1 en = 

n IV2 y es nula en todos los puntos del abierto WD(U\ dU) . Sus derivadas 
parciales serán nulas en dicho abierto y por continuidad también lo serán en p. 
Por consiguiente dg(p) = 0 y así dg\{p) = dg2 (p). 

En consecuencia podemos definir df(p) = dg(p), donde g es cualquier ex- 
tensión de / a un entorno de p en IR". En particular podemos hablar de las 
derivadas parciales sucesivas de / en los puntos frontera de su dominio, las 
cuales están completamente determinadas por /. 

A partir de aquí todos los resultados válidos para funciones / : U — > IR" 1 de 
clase C k donde U es un abierto en IR™ se extienden trivialmente al caso en que 
U es un abierto en un semiespacio. Ahora podemos modificar nuestra definición 
de variedad para admitir puntos frontera: 

Definición 10.2 Un conjunto S C R m es una variedad diferenciable (con fron- 
tera) de dimensión n < m y de clase C q si para cada punto p € S existe un en- 
torno V de p, un abierto U en un semiespacio de IR™ y una función X : U — > IR m 
de clase C q de modo que el rango de la matriz JX sea igual a n en todo punto 
y X : U — > S ílV sea un homeomorfismo. 
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En el resto de la sección la palabra "variedad" hará referencia a variedades 
con frontera. Veamos en primer lugar que el teorema 5.4 vale también para 
variedades con frontera, es decir, que si X : U — > S es una carta de una 
variedad S de clase C q y uo £ U, entonces existe un entorno G de uo en IR™, un 
entorno V de X{uq) en R m y una aplicación g : V — > G de clase C q tal que 
P^Gnt/) -1 = g\vns- 

En efecto, tenemos que JX(u 0 ) tiene rango máximo, luego n de sus filas 
tienen determinante no nulo. Por simplicidad podemos suponer que son las 
primeras. Entonces X(u) = (Ai(u),X 2 (u)), donde X\ tiene las n primeras 
coordenadas de X y X 2 las restantes, de modo que JXi(tt 0 ) tiene determinante 
no nulo. La función X se extiende a una función de clase C q en un entorno de 
uo en IR™, luego lo mismo le ocurre a X\. Sea X\ una extensión. Por el teorema 
de inyectividad local y el teorema de la función inversa obtenemos un entorno 
G de u 0 en R™ de modo que W = X^G] es abierto en R n , Xi\g '■ G — > W es 
biyectiva y es de clase C q . 

Sea V un abierto en R m tal que X[E/] = V D S, sea tt : R m — > R n 
la proyección en las n primeras componentes, sea V = w~ 1 [W] n V y sea 
g = ir o (Xi|g) _1 , que es una función de clase C 9 . Claramente A(u 0 ) € V. 
SipG VnScy'ílS entonces p = X(u), para un cierto u € U, además 
X^u) e IV, luego u £ GnU y así p £ X[G n £/]. 

Recíprocamente, si € I[Gíl Í7], entonces € W, luego tenemos 

x(u) eynSy 

g(X(u)) = (X^-^X^u)) =u=(X\ GnU )- 1 (X(u)). 

Así concluimos que (Xlcnu)^ 1 = g\vns- ■ 

Con esto la prueba del teorema 5.5 se adapta fácilmente para probar la 
versión para variedades con frontera: 

Teorema 10.3 Sea S C R m una variedad de dimensión n y de clase C q . Sea 
p £ S y X : U — > S n V, Y : U' — > S H V dos cartas alrededor de p. Sean 
V 0 = V n V, E/o = X- 1 ^}, U¿ = Y'^Vo]. Entonces U 0 y U¿ son abiertos en 
semiespacios de R n y la aplicación X o Y^ 1 : U a — > U¿ es biyectiva, de clase 
C q y con determinante jacobiano no nulo, con lo que su inversa es también de 
clase C q . 

Definición 10.4 Sea S una variedad con frontera. Un punto p £ S es un punto 
frontera de S si cuando X : U — > S es una carta alrededor de p entonces las 
coordenadas X -1 (p) son un punto frontera de U. Por el teorema anterior esto 
no depende de la elección de la carta. Llamaremos frontera de S al conjunto dS 
de puntos frontera de S. 

Es claro que dS es cerrado en S (quizá vacío) y que S \ dS es una variedad 
en el sentido del capítulo V. De este modo las variedades sin frontera coinciden 
con las variedades con frontera cuya frontera es vacía. 

A partir de aquí toda la teoría de variedades diferenciales se generaliza sin 
dificultad para el caso de variedades con frontera: podemos definir los espacios 
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tangentes, la diferenciabilidad y la diferencial de aplicaciones entre variedades, 
etc. todo sin cambio alguno. Sólo hay una salvedad: podemos definir el pro- 
ducto de una variedad con frontera por una variedad sin frontera, pero no el 
producto de dos variedades con frontera. La razón es que el producto de un 
abierto en un semiespacio de W n por un abierto en IR™ es un abierto en un 
semiespacio en R m+n , mientras que el producto de dos abiertos en dos semies- 
pacios no es necesariamente un abierto en un semiespacio. Por ejemplo, el 
producto de dos semirrectas cerradas es un cuadrante cerrado en R 2 , que no 
es un abierto en ningún semiplano. Para admitir productos de variedades con 
frontera tendríamos que definir variedades con esquinas. 

Por otra parte no es necesario generalizar el cálculo integral al caso de varie- 
dades con frontera. Si el lector se molesta en hacerlo demostrará que la frontera 
de una variedad siempre tiene medida nula, luego en la práctica podemos inte- 
grar en el conjunto de puntos interiores. 

Ejemplo Una bola cerrada en W 1 es una variedad cuya frontera coincide con 
su frontera topológica. En efecto, consideremos por ejemplo la bola B de centro 
0 y radio 1 . Para cubrir los puntos interiores tomamos como carta la identidad 
en la bola abierta. Veamos ahora una carta que cubre los puntos frontera de 
la semiesfera x n > 0. Similarmente se cubren los puntos restantes. Definimos 
X : W"-- 1 x ]0, 1] — > B mediante 



Claramente el dominio U = IR™ -1 x ]0, 1] es un abierto en el semiplano 
x n < 1 y X puede extenderse hasta el abierto M™^ 1 x ]0, +oo[ mediante la 
misma expresión, y ciertamente es de clase C°° . 

Podemos ver X como sigue: dados (u, r) construimos el punto (u, 1) que está 
en el plano tangente a la esfera por su polo norte, dividimos por su norma, con 
lo que pasamos a un punto de la esfera (distinto para cada valor de u) y luego 
multiplicamos por r, con lo que pasamos a un punto de la esfera de radio r. 
Teniendo esto en cuenta es claro que X es inyectiva. Concretamente su inversa 
es 



que es diferenciable, por lo que las diferenciales de X y X 1 son mutuamente 



Ejercicio: Probar que una corona esférica cerrada (es decir, una bola cerrada menos 
una bola abierta concéntrica) es una variedad con frontera. 

Ejercicio: Probar que un casquete esférico cerrado es una variedad con frontera. 




(ru, r 



') 





inversas, luego JX tiene rango n. 



Ejercicio: Probar que un cuadrado cerrado menos sus cuatro vértices es una variedad 
con frontera. (Con los vértices sería una variedad con esquinas.) 
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Ejercicio: Definimos el toro sólido de radios r y R (tales que 0 < r < 7?) como la 
imagen de K 2 x [0, r] por la aplicación 

X(u, v, p) = (ñcosw + p eos u eos tí, Rsenv + pcosusenv, psenu). 

Probar que es una variedad cuya frontera es igual al toro de radios r y R. 

Vamos a probar que la frontera de una variedad 5 es a su vez una variedad 
(sin frontera) de una dimensión menos. Para ello probamos el teorema siguiente, 
que además nos permitirá relacionar las orientaciones de S y dS. 

Teorema 10.5 Sea S una variedad de dimensión n > 1 y seap € dS. Entonces 
p puede cubrirse por una carta X : U — > Vil S tal que U = ]— 1,0] X ]— 1, 1[? _1 
los puntos de VíldS son exactamente los puntos deVílS tales que x\ = 0, los 
puntos de V(~\S\dS son los puntos de V(~\S tales que x\ < 0 y p = X(0, . . . ,0). 
Si S es orientable la carta puede tomarse positiva. 

DEMOSTRACIÓN: En principio podemos tomar una carta cuyo dominio sea 
un abierto en un semiespacio de modo que los puntos de la frontera tengan 
coordenadas en un cierto hiperplano afín de IR™ . Componiendo la carta con una 
aplicación afín (que es de clase C°°) podemos exigir que dicho hiperplano sea 
x i = 0 y que el semiespacio de coordenadas sea X\ < 0. Más aún, podemos 
exigir que las coordenadas de p sean nulas. El dominio de la carta será un 
entorno de 0, luego contendrá un semicubo de centro 0. Componiendo con una 
homotecia podremos conseguir que contenga el semicubo U del enunciado y 
restringiendo la carta a U tenemos una carta en las condiciones pedidas. Si S 
está orientada y la carta que hemos obtenido es negativa basta tomar la carta 
X(xi, . . . ,x n ) = X(x\, . . . ,x n -i, — x n ) y pasamos a tener una carta positiva 
(aquí usamos que n > 1). ■ 

Teorema 10.6 Sea S una variedad de dimensión n y clase C q con frontera no 
vacía. Entonces dS es una variedad (sin frontera) de dimensión n — 1 y clase 
C q . Basta tomar como cartas las de la forma Y(x 2 , ■ ■ ■ , x n ) = X(0, x 2 , ■ ■ ■ , x n ), 
donde X es una carta del tipo dado por el teorema anterior (con lo que Y está 
definida sobre el cubo ]— 1,1[™ ). Si S es orientable y tomamos sólo cartas 
positivas obtenemos un atlas orientado para dS. 

Demostración: Por el teorema anterior todo punto de dS es cubrible por 
una de estas cartas. Claramente son de clase C q y JY(x2, ■ ■ ■ ,x n ) se obtiene 
quitando la primera fila a JX(0, X2, ■ ■ ■ , x n ), luego su rango es n — 1. También 
es evidente que Y : ]-l,l[" _i — > VDdS es un homeomorfismo. 

Supongamos ahora que S es orientable y que tenemos dos cartas positivas 
Y\ e y 2 que cubran a un mismo punto, obtenidas a partir de cartas X\ y X 2 . 
Consideremos la aplicación g = X^ 1 o X 2 . Tenemos que <?i(0, x 2 , ■ ■ ■ , x n ) = 
0 para todas las coordenadas (x 2 , . . . , x n ), pues g hace corresponder puntos 
frontera de Lq con puntos frontera de U 2 . Por lo tanto Digi(x 2 , . . . ,x n ) = 0 
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para todo i > 1, luego la matriz jacobiana de g es de la forma 



/ D l9l 



Jg(0,x 2 , ■ . .,x n ) 



i) 



V o 



.4 



Sea h = o Y 2 . Claramente h = l o g o tt, donde i(x%, . . . , x n ) = 

(0, X2, ■ • • , x n ) y 7r(a;i, . . . , x n ) — {x 2 , . . . , x n ). Considerando las matrices ja- 
cobianas concluimos fácilmente que Jh(x 2 , ■ • ■ , x n ) = A. Así pues 

\Jg(0,x 2 , . . .,x n )\ = D 1 g 1 (0,x 2 , ...,x n ) \Jh(x 2 , ■ ■ -,x n )\. 

Como las cartas X\ y X 2 son positivas tenemos que primer determinante es 
positivo. Si probamos que D\gi(0, x 2 , . . . ,x n ) > 0 tendremos que el determi- 
nante de Jh será positivo también, y esto probará que Y\ e Y 2 tienen la misma 
orientación. Ahora bien, 



g x (r, x 2 ,...,x n ) 




Si r < 0 estamos en las coordenadas de un punto de S, luego g{r, x 2 , . . . , x n ) es 
la primera coordenada de dicho punto en la carta X 2 , luego g(r,x 2 , . . . ,x n ) < 0, 
luego el cociente es positivo y el límite (que ciertamente es no nulo) es también 
positivo. ■ 

En lo sucesivo, cuando S sea una variedad orientada sobreentenderemos que 
OS tiene la orientación dada por el teorema anterior. 

Ejemplo Consideremos la variedad con frontera S in- 
dicada en la figura dotada de la orientación usual. En- 
tonces dS queda orientada de modo que al recorrerla en 
sentido positivo giramos en sentido contrario a las agujas 
del reloj. En efecto, dado un punto p en la frontera de 
coordenadas (0, v 0 ), sea X una carta positiva que lo cubra. La curva X(u,v 0 ) 
está dentro de S cuando u < 0 y fuera de S cuando u > 0 (recordemos que las 
coordenadas se pueden extender un poco fuera de S) . Por consiguiente el vector 
X u apuntará hacia fuera de S. Como la base (X U ,X V ) ha de ser positiva, el 
vector X v ha de marcar la dirección de giro antihoraria. En el teorema anterior 
hemos adoptado los convenios necesarios para que esto sea así. 

En cambio, si la variedad tiene un agujero, la frontera 
^\ del mismo quedará orientada en sentido horario (el vector 
( ) ) X u apuntará hacia el interior del agujero). Es fácil ver 

en general que si V C K m es una variedad de dimensión 
m con la orientación natural en M. m (la dada por la base 
canónica), entonces la orientación en dV es la inducida por el vector normal que 
apunta hacia fuera de V. 
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10.2 La diferencial exterior 

Recordemos que nos dirigimos hacia la prueba del teorema de Stokes gene- 
ralizado, que nos da una relación de la forma 




Ahora ya sabemos qué debemos entender por dS, pero nos falta definir la 
diferencial de una fc-forma arbitraria w, que ha de ser una k + 1-forma. La 
idea básica es muy simple: la diferencial de la n- forma / dx\ A • • • A dxk será la 
k + 1-forma df A dx\ A • • • A dxk ■ Sin embargo, esto no nos sirve como definición, 
pues hemos de justificar que el resultado no depende del sistema de coordenadas 
con el que trabajamos. Como al diferencial perdemos un grado de derivabilidad, 
para evitar cuestiones técnicas al respecto a partir de ahora supondremos que 
todas las variedades y funciones que consideremos serán de clase C°° . El lector 
puede entretenerse relajando las hipótesis de derivabilidad en cada caso hasta 
las estrictamente necesarias. Todos los resultados valen para variedades con 
frontera. 

Teorema 10.7 Si S es una variedad diferenciable existe una única aplicación 
lineal d : A(S) — > A(S) que cumple las propiedades siguientes: 

a) Si f e A 0 (£), entonces df es la diferencial de f en el sentido usual. 

b) Para cada üü € A k (S) se cumple que du; € A k+1 (S). 

c) Si ujx E A k (S) y uj 2 £ A(S). entonces 

d(u>i A íü2) = duji A lü2 + (—l) k iúi A duj2- 

d) d 2 = dod=0. 

e) Si uo € A(S) se anula en un abierto V C S entonces duj también se anula 
en V. 

Demostración: En primer lugar probaremos que la última propiedad es 
consecuencia de las anteriores. Para cada p € V existe una función {p} ~< f ~< V. 
Entonces la forma fu; es nula, y como la diferencial es lineal ha de ser 

0 = d(fui) = df A u) + f A duj, 

luego duj(p) = (/ A dw)(p) = -df(p) A 0 = 0. 

Notemos que la propiedad e) junto con la linealidad de la diferencial prueba 
que si dos formas coinciden en un abierto de S entonces sus diferenciales también 
coinciden. 

Ahora probamos que si existe la diferencial es única. Tomemos un punto 
p G S y sea X : U — > V C S una carta alrededor de p. Tomemos un entorno 
de p cuya clausura K sea compacta y esté contenida en V. Sea K -< f -<V . 
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Si lo £ A k (S) entonces u)\y se expresa como 

^ u>i 1 ... ik dx ll A • • • A dx lk , (10.1) 

l<¿l<---<ú.<n 

para ciertas funciones LOi x ...i k de clase C°° en V. 

La forma fio coincide con lo en un entorno de p y sus coeficientes son las 
funciones Lo il ... ik — fw^...^. Estas funciones se anulan fuera de un compacto 
contenido en V, luego podemos extenderlas a funciones de clase C°° en S ha- 
ciendo que tomen el valor 0 fuera de V. Similarmente, las funciones j/¿ = fxi 
extendidas como 0 fuera de U son de clase C°° en S y coinciden con las x¿ en 
un entorno de p. Por consiguiente dyi coincide con dxi en un entorno de p. Así 
pues, la forma fio (y por consiguiente lo) coincide con la forma 

¿>= ^2 üñ-indyi! A ■ ■ ■ A dy ik 

l<i 1 <---<i k <n 

en un entorno de p. Ahora calculamos 

dü)= ^ dü^... lk A dy lt A • • • A dy ik , 

l<¿i<---<¿fc<n 

pues una simple inducción prueba a partir de c) y d) que d(dyi 1 A ■ ■ ■ A dyi k ) = 0. 
Teniendo en cuenta que la diferencial depende sólo del comportamiento local de 
las formas llegamos a que 

du{p)= duj n ... ik (p)Adx ll (p)A---Adx lk (p). (10.2) 

l<¿l<---<¿fc<n 

Ahora bien, por la propiedad a) tenemos que el miembro derecho de la 
igualdad anterior es el mismo cualquiera que sea la función d que cumpla las 
propiedades del enunciado. En consecuencia la diferencial exterior es única. 

Veamos que toda variedad cubrible por una sola carta tiene una diferencial 
exterior. En tal caso toda fc-forma lo se expresa de forma única como (10.1). 
Para cada punto p definimos du)(p) mediante (10.2). Claramente du; así defi- 
nida es una k + 1-forma (de clase C°°) y la diferencial d es lineal. Las únicas 
propiedades que no son evidentes son c) y d). 

Puesto que los dos miembros de la igualdad c) son lineales en ui y u>2, basta 
probar que se da la igualdad cuando 

lo\ = fi dx h A • • • A dx lk , lü 2 = ¡2 dx n A • • • A dx jr . 

Entonces 

lo\ A lü2 = fif 2 dx i± A • • • A dx ik A dxj 1 A ■ ■ ■ A dxj r , 

luego 



d(ui A lü2) = (f 2 dfi + fi df 2 ) A dx it A • • • A dx ik A dx jl A • • • A dx jr 
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fi df\ A d,Xi x A • • • A dx ik A dxj 1 A • • • 
+/i df 2 A cía;»! A • • • A c?x ¿fc A dxj ± A • • 
dfi A ctejj A • • • A da;¿ fc A f 2 dxj 1 A • • • 
+ (-l) fc /i^¿i A • • • A dx lk A d/ 2 A dx 
düü 1 Alü 2 + (-l) fc ^i A duj 2 . 



A cfa^v 
• • A dxj r 
A dar¿ r 

^ A • • • A dx,. 



Del mismo modo, basta comprobar que d) se cumple para una forma de tipo 



y basta ver que d 2 = 0 al actuar sobre 0-formas, pues una inducción usando la 
propiedad c) ya demostrada nos da el caso general de d). Veamos, pues, que 
d(df)) = 0. En efecto, sabemos que 



Consideremos finalmente una variedad arbitraria S. Si p G S y V es la 
imagen de una carta que cubre a p, entonces tenemos definida una diferencial 
exterior dy en A(V). Para cada forma lo G X(S), definimos du>(p) = dv(w\v)(p)- 
Veamos que la forma duj{p) no depende de la elección de V . 

Si tomamos dos cartas X e Y con imágenes V\ y V 2 entonces V\ f~l V 2 también 
es la imagen de una carta, luego también tenemos definida una diferencial ex- 
terior en A(Vi n V 2 ). Ahora bien, si u\v admite la expresión (10.1), entonces 
^|vinv 2 admite la misma expresión (restringiendo las funciones y Xi j a 

Vi H V 2 ). Por consiguiente dv{íjj\v 1 ){p) — dv 1 nv 2 M v 1 nv 2 )(p)í P ues ambas vie- 
nen dadas por (10.2). Por otro lado dv(u\v 2 )(p) = dv 1 nv- ¡ ( u \v 1 nv- ¡ )(p)- Ahora 
usamos que la diferencial en A(Vi (~1 V 2 ) es la misma independientemente de la 
carta con la que se calcula (por la unicidad que hemos probado) y concluimos 
que dv(v\vi)(p) = dv(u\v 2 )(p)i como queríamos probar. 

Con esto tenemos definida una aplicación d : A(S) — > A(S). Notemos que 
dw es realmente una forma de clase C°° porque si p G S y V es la imagen de 
una carta que cubre a p tenemos que (dtu)\v = d v (üo\ v ) y ésta es una forma de 
clase C°°. Esta misma relación justifica también que d es lineal, así como que 
verifica las propiedades del enunciado. ■ 



u> = f dx il A • • • A dxi 



Entonces 



du¡ = df A dxi 1 A • • • A dx. 




En consecuencia 
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Si no suponemos que las formas son de clase C°° podemos definir igualmente 
la diferencial de una forma de clase C k como una forma de clase C fc_1 y todas 
las propiedades del teorema anterior se cumplen igualmente con las restricciones 
obvias. Por ejemplo, para d(doj)) = 0 hemos de exigir que lo sea al menos de 
clase C 2 . Veamos algunos casos particulares de la diferencial exterior: 

Definición 10.8 Sea F : U C M. 3 — > M 3 un campo de vectores definido sobre 
un abierto U. El rotacional de F es el campo rot F : U — > IR 3 dado por 



rotF 



ei e 2 e 3 

d d d 

dx dy dz 

F\ F2 F 3 



dF 3 dF 2 dFx dF 3 dF 2 _ dF x 
dy dz ' dz dx dx dy 



+ 



Por supuesto que el determinante intermedio es sólo una regla mnemotécnica, 
que también puede abreviarse como rot F = V AF. La relación con la diferencial 
exterior es la siguiente: según vimos en el capítulo anterior, al campo F le 
podemos asociar la 1-forma F df '= F\dx + F 2 dy + F 3 dz. La diferencial de esta 
forma es 

ídF-x dFo\ 

d(F df) = dFi A dx + dF 2 A dy + dF 3 A dz = — - - —± dy A dz 

\ dy dz J 

'dF, dF 3 \ (dF 2 dFA 

— — )dz A dx + — — \ dy A dz 

dz dx J \ dx dy J 

= d$(rotF)). 

Es decir, la diferencial del elemento de circulación de F es el elemento de 
flujo del rotacional de F. 

Si / : U — > R es un campo escalar, es claro que df = V/ df, luego 

0 = d 2 f = d(Wfdf) = d$(rot V/)), 

de donde se sigue la relación 

rotV/ = 0, 

para todo campo escalar /. 

Definición 10.9 Sea F : U C IR™ — > K™ un campo de clase C°° en un abierto 
U. La divergencia de F es el campo escalar div F : U — > R dado por 

j. P dF, dF n 

divF = 1 h ^ — . 

dx, dx n 

Claramente 

n 

d(d$(F)) = ^2(-l) i+1 dFi Adx x A ■ ■ ■ A dx t _ x A dx i+í A ■ ■ ■ A dx n 

i=l 

= dxi A dxi A ■ ■ ■ A dxi_i A dx i+1 A ■ ■ ■ A dx n 

i=i ÓXl 

n dF- 

= — — - dx\ A ■ ■ ■ A dx n = div F dm. 
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Así pues, la diferencial del elemento de flujo de F es la divergencia por el 
elemento de volumen de R™. En particular, si n = 3 y aplicamos esto a rotF 
resulta 

divrot Fdm= d(d$(rotF)) = d(d(F dr)) = 0, 

luego 

div rot F = 0, 

para todo campo vectorial F. 

El teorema de Stokes, que probaremos en la sección siguiente, no sólo nos 
permitirá aprovechar estos conceptos que acabamos de introducir, sino que nos 
dará interpretaciones geométricas de los mismos. 

Conviene observar que en algunos contextos usamos la letra d para indicar 
algo que no es una diferencial exterior. Así por ejemplo, el elemento de medida 
dm no es la diferencial exterior de ninguna forma m, ni tampoco lo es en general 
el elemento de flujo de un campo d$(F). En estos caso la d sólo indica que la 
medida se obtiene integrando dm o que el flujo se obtiene integrando d<S>(F), 
pero sería incorrecto afirmar cosas como que d(d<S>(F)) = 0. 

Terminamos la sección con una propiedad importante de la diferencial: 

Teorema 10.10 Sea f : S — > T una aplicación de clase C°° entre variedades. 
Entonces la retracción /" : A(T) — > A(5) conmuta con la diferencial exterior, 
es decir, p(dui) = dfi(w), para toda u € A(T). 

DEMOSTRACIÓN: Es claro que el valor de ambas formas en un punto p 
depende únicamente de los valores que toma lo en un entorno de f(p), luego 
no perdemos generalidad si suponemos que T es el rango de una carta Y de 
coordenadas yi,...,y n - En tal caso basta probar que 

f{d(gd yil A • • • A dy ik )) = d(f t (gdy ll A • • • A dy lk )). 

Ahora bien, ambos miembros son d(f o g) A d(f o y ¿1 ) A • • • A d(f o y ik ) . ■ 

10.3 El teorema de Stokes 

Ahora ya tenemos todos los elementos necesarios para enunciar el Teorema 
de Stokes. Sin embargo debemos introducir algunos más que nos servirán de 
ayuda en la demostración. 

Definición 10.11 Un n-cubo es un conjunto de la forma 

S = [ai,bi] x • • • x [a n ,b n ], 

donde a¿ < &¿ son números reales. La frontera (topológica) de S en IR™ está 
formada por la unión de los 2n conjuntos 

Sf = [ai,&i] x ••• x {cti} x ••• x [a n ,b n ], 

S¡ = [ai,6i] x ••• x {bí} x ••• x [a n ,b n ], i = l,...,n, 

a los que llamaremos caras del cubo. 
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Una forma diferencial en un cubo S es simplemente una forma diferencial 
definida en un abierto de K n que contenga a S. Consideraremos a dicho abierto 
como variedad orientada, tomando a la identidad como carta positiva (con lo 
que la base canónica de M. n es positiva). En particular tenemos definida la 
integral de una n-forma sobre un n-cubo. 

Si lü es una n — 1-forma en un cubo S, donde n > 1, vamos a definir la 
integral de w sobre dS. Para ello comenzamos definiendo la integral sobre cada 
cara. Consideramos primero una forma de tipo 



u(xi, ...,x n ) = f(xi, . 



La integral de u> sobre la cara Sj (para j = 1, 
igual a 0 si j ^ i y en caso contrario mediante 



x n ) dxi A • • • A dxi^i A dxt+i A • • • A dx n . 

, n y k — 0, 1) se define como 



S? 



f(xi,. 



j) dx\ ■ ■ ■ dxi-i dxi+i ■ ■ ■ dx r , 



, x n ) dxi ■ ■ ■ dxi-i dx i+ i ■ ■ ■ dx n , 



donde C = [01,61] x • • • x [oj_i,6i_i] x [a¿ + i,6¿+i] x • • • x [a n ,b n ]. 

Una n — 1-forma arbitraria se descompone de forma única en suma de n for- 
mas del tipo anterior (en cada una de las cuales falta un dxi distinto) . Definimos 
su integral sobre la cara S\ como la suma de las integrales de estas n formas. 
Así tenemos definida J sk u> para cualquier n — 1-forma sobre S. La integral es 
obviamente lineal en u. 

Finalmente definimos 



/ -=E(-ir(7 

Jas i=1 \Js 




s° 

Conviene entender por qué es ésta la definición co- 
rrecta de integral sobre dS. Pensemos por ejemplo en 
un cubo tridimensional. Según la fórmula las integrales 
sobre caras opuestas se suman con signos opuestos. Con- 
cretamente tienen signo positivo las dos que en la figura 
aparecen sombreadas más la situada sobre el plano XZ, 
que no se ve. Nuestra intención es tratar al cubo como 
si fuese una variedad con frontera. No lo es a causa de 
que la frontera tiene aristas donde no es diferenciable, pero a efectos de la in- 
tegración esto no va a afectar porque las aristas tienen área nula, y el teorema 
de Stokes va a ser cierto también sobre el cubo. La orientación que debemos 
imponer a la frontera en analogía con las variedades es la inducida por el vector 
normal que apunta hacia fuera del cubo. Supongamos que queremos integrar 
una forma de tipo f(x, y, z) dx A dz. Es claro que sólo van a influir las caras con 
y constante, pues dx es nula en las caras con x constante y dz es nula en las 
caras con z constante. 

Para integrar la forma sobre Sy (la cara que en la figura queda a la derecha) 
consideramos la carta X{x,z) — (x, yo, z) . La base asociada en el plano tangente 
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de cada punto es X x = (1, 0, 0), X z = (0, 0, 1), y por consiguiente X x A X z = 
(0,-1,0), que apunta hacia dentro del cubo, luego la carta es negativa y la 
integral es 



y el signo corresponde con el que hemos establecido en la definición. En cambio, 
si la integral es sobre la cara opuesta, ahora el vector (0, —1,0) sí que apunta 
hacia fuera del cubo, luego la carta es positiva y no hay que cambiar el signo, 
tal y como indica la definición. 

Mediante este tipo de razonamientos es posible justificar que la definición 
que hemos dado hace que la integral sobre dS sea la correcta respecto a la 
orientación de las caras inducida por la orientación usual del interior del cubo, 
es decir, la que hace positiva una base de una cara si al añadirle como primer 
vector uno que apunte hacia fuera del cubo obtenemos una base positiva de 
IR™. De todos modos esto no es muy importante, pues sólo vamos a usar las 
integrales sobre cubos como un paso previo a la prueba del teorema de Stokes 
sobre variedades orientadas. 

Ejercicio: Representar gráficamente la orientación de la frontera de un cuadrado 
según la definición que hemos dado. 

Si definimos la integral de una 0-forma sobre la frontera de un 1-cubo, es 
decir, de una función / sobre los extremos de un intervalo S = [a, b], como 



el teorema siguiente tiene sentido para n = 1 y entonces no es más que la regla 
de Barrow: 

Teorema 10.12 (Teorema de Stokes para un cubo) Sea S un n-cubo y u 
una n — 1- forma en S. Entonces 



Demostración: Según acabamos de comentar, el caso n = 1 es simple- 
mente la regla de Barrow. Supongamos, pues n > 1. Por la linealidad de la 
integral y de la diferencial es suficiente probar el teorema cuando la forma es 

u(xi, . . . , x n ) = f(xi, . . . , x n ) dx\ A • • • A dxi-i A dx i+1 A • • • A dx n . 

Por definición la integral de u es nula sobre todas las caras de S excepto S¿, 
para k = 0, 1. Así pues, J gs w es igual a 




) dxdz, 





U). 



/ (f(xi, ■ ■ ■ ,<k, ■ ■ -,Xn)-f(xi, ...,bi,.. -,x n )) dxi ■ ■■dx i ^ 1 dx i+1 ■ ■ ■ dx n , 
Je 
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donde C es el cubo que resulta de eliminar el ¿-ésimo intervalo a S. Por otro 
lado, 

dui = df A dx\ A • • • A A dx i+ i A • • • A dx n 

df 



dxi A dx\ A • • • A dxi-i A afo ¿+ i A • • • A afe,, 

OXi 



= (- 



l) 1-1 -^-^! A---Adx r , 



dxi 



Así pues, 



/ du = (-íy- 1 [ p-d Xl ---dx n . 
Js Js 9xí 



Por el teorema de Fubini podemos integrar primero respecto a dxi, para lo 
cual aplicamos la regla de Barrow y queda 

/ (f(xi, ...,bi,..., x n )-f(xi, . . . , o¿, . . . , x n ))dxi ■ ■ ■ dxi-idx l+ i ■ ■ ■ dx n , 
Je 

que coincide con la integral sobre la frontera. ■ 

Teorema 10.13 (Teorema de Stokes generalizado) Sea S una variedad di- 
ferenciable orientable de dimensión n > 1 y lj una n — 1-forma en S de soporte 
compacto. 1 Entonces 



[ du= í 

JS Jd 



üü. 

OS 

Demostración: Vamos a definir para cada punto p € S un entorno V p en S. 
Si p es un punto interior tomamos una carta positiva X p : U p — > S alrededor de 
p, donde U p es una bola abierta en K™. Tomamos un cubo C p C U p que contenga 
en su interior al vector de coordenadas de p y llamamos V p a la imagen por X p 
del interior de C p (que obviamente es un entorno de p en S. 

Si p € dS tomamos una carta positiva X p : U p — > S de modo que 

X p (Q, . . . , 0) = p y los puntos de ¿55 en X p [U p ] sean exactamente los que cumplan 
x\ — 0 (una leve modificación de la prueba del teorema 10.5 prueba la existencia 
de tal carta). Es claro que X p induce una carta positiva en ¿95. Llamamos 
C p = [—1,0] x [—1, l] n_1 , que es un entorno de 0 en U p y tomamos como V p 
la imagen por X p del interior de C p , es decir, de ]— 1,0] x ]— 1, que es un 
entorno de p en S. 

Los abiertos V p cubren el soporte de lo, que por hipótesis es compacto, luego 
existe un subcubrimiento finito formado por los abiertos V Pl , . . . , V Pr . Por el 
teorema 7.27 existen funciones h\, . . . , h r en S (que según hemos comentado las 
podemos tomar de clase C°°) de modo que /i¿ -< V p . y h\ + ■ ■ ■ + h r toma el 
valor 1 sobre cada punto del soporte de uj. 



1 Un análisis de la prueba muestra que basta exigir que 5 sea de clase C 2 y u> de clase C 1 . 
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Sea u>i = hiiv, que claramente es una n — 1-forma (de clase C°°) con soporte 
compacto contenido en V Pi . El complementario del soporte de w¿ es un abierto 
donde w¿ se anula, luego lo mismo le ocurre a duji, es decir, que duji también 
tiene el soporte contenido en V Pi . Además lo = u)\ + ■ ■ ■ + ui r , luego 



/ duj = yz / du} i = s >2 / duji, / w = y~] / Ui = y2 

Js l=1 Js l=1 Jv Pt JdS l=1 JdS i=1 Jv Pi 



Por consiguiente basta probar que 



ñas 



dlúi = Lüi, 

v Pi Jv Pz nos 

es decir, hemos reducido el problema al caso local en que el soporte de la forma 
está contenido en el rango de una carta. Por simplificar la notación eliminaremos 
los subíndices, que son ya innecesarios. Hemos de probar que 

í du= í u), (10.3) 

Jv p Jv p nds 

donde w es una n— 1-forma con soporte compacto contenido en V p . Por linealidad 
podemos suponer además que 

u) = f dxi A • • • A dxi_i A dx i+í A • • • A dx n . 

Llamemos 

üü* = (X p o /) dxi A • • • A dxi-i A dx i+í A • • • A dx n , 

que es una n — 1-forma definida en U p cuyo soporte es la antiimagen por el 
homeomorfismo X p del soporte de el cual estará contenido en la antiimagen 
de V p , que es el interior del cubo C p . 
Como en teorema anterior, vemos que 

df 

doj= (— l) í_1 — ^- dx\ A • • • A dx n . 
dxi 

Para calcular el primer miembro de (10.3) transformamos la integral me- 
diante la carta X p , con lo que obtenemos 

J c (-I) 1 - 1 [x p o dx\ A • • • A dx n . 

Teniendo en cuenta la definición de la derivada parcial de una función en una 
variedad es claro que 

x q df = d(X p0 f) 
p dxi dxi 
y al calcular igualmente duj* obtenemos 



í duj= í 
Jv„ Jc 



doj*. 

Cr> 
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Con esto podemos probar (10.3) en el caso en que p es un punto interior de 
S. En efecto, entonces V p no corta a dS, luego el segundo miembro es nulo. Por 
otra parte, el soporte de lo* está contenido en el interior del cubo C p , luego lo* 
es nula en dC p , luego el teorema de Stokes para un cubo nos da que 



/ dio = du)* = ¡ 

JV„ JC„ JdC 



LO* = 0. 



Así pues, en adelante supondremos que p € dS. Para evaluar el segundo 
miembro de (10.3) usamos la carta positiva X(Q, X2, ■ ■ ■ ,x n ). Notemos que en 
V p n dS la función x\ es constante, luego dx\ = 0. Supongamos primero i = 1. 
La carta transforma V p n dS en la cara (C p )\ del cubo, luego 

/ Lü = f(X p (0,X2,...,x n ))dx2---dx n = / LO*, 

Jv p ndS J(C P )\ J{C P )\ 

(la última igualdad por definición de integral sobre una cara). La igualdad 



/ lo= í LO* 

Jv p ndS J{C P )\ 



es válida aunque sea i^l, pues en tal caso lo es nula en Vpfl dS y el miembro 
derecho es nulo por definición. En definitiva, la igualdad (10.3) que tenemos 
que probar se reduce a 



í dlO* = í LO*. 

J Cn J ( C„ ) } 



'{C P )\ 

Por el teorema de Stokes para un cubo basta probar que 



/ uo*= f LO*. 
JdC v J(C V )\ 



(C P )} 

Ahora bien, lo* tiene el soporte contenido en la antiimagen por X p de V p , 
que es ]— 1,0] x ] — 1, 1[™~ , lo que significa que lo* es nula sobre todas las caras 
de C p salvo quizá {C p )\, y aplicando la definición de integral sobre la frontera 
de un cubo tenemos la igualdad anterior. ■ 

El teorema anterior engloba a muchos casos particulares conocidos desde 
mucho antes, uno de ellos el Teorema de Stokes propiamente dicho, que se 
obtiene al aplicarlo al elemento de circulación de un campo en M 3 a través de 
una curva. 



Teorema 10.14 (Teorema de Stokes) Sea S una superficie compacta orien- 
table contenida en un abierto U C M. 3 y sea F : U — > IR 3 un campo vectorial. 
Entonces 

/ (rotF)nda = Fdr, 

JS JdS 

donde n es el vector normal a S que determina su orientación. 
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En otras palabras: el flujo del rotacional a través de la superficie es igual a su 
circulación en la frontera. Es consecuencia inmediata de la relación d(F dr) = 
d<I>(rot F), que demostramos en la sección anterior. La compacidad de la super- 
ficie implica la del soporte de la forma. 

Consideremos ahora la relación d(d$(F)) = div F dm, que demostramos en 
la sección anterior. Al aplicarle el teorema de Stokes generalizado obtenemos 
otro importante teorema clásico debido a Gauss: 

Teorema 10.15 (Teorema de la divergencia) Sea V C M. m una variedad 
compacta de dimensión m contenida en un abierto U. Sea F : U — > R m un 
campo vectorial. Entonces 

/ div F dm = / Fn da, 
Jv JdV 

donde n es el vector normal a dV que apunta hacia fuera de V . 

En otros términos, el flujo de un campo a través de una superficie cerrada 
es igual a la integral de la divergencia sobre el recinto que limita. 

Ejemplo El campo F(x) = x cumple divF = n, luego el teorema de la 
divergencia nos da una fórmula para el volumen n-dimensional V encerrado por 
una superficie S: 

V= - [ d$(x). 
n Js 

Destacamos los casos particulares n = 2 y n = 3. El área de una figura 
plana limitada por una curva C es 




— ydx. 



El volumen de una región del espacio limitado por una superficie S es 



V = - / x dy A dz + y dz A dx + z dx A dy. 
3 Js 

Por ejemplo, la elipse de semiejes a y b admite la parametrización x — a eos t, 
y = bsent. Por consiguiente su área es 

1 f 27T 

A = - / (ab eos 2 t + ab sen 2 t) dt = nab. 

2 Jo 



Ejercicio: Calcular el área de la cardioide mediante la fórmula anterior. 
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Ejemplo Consideremos el campo F : R n+1 — > R n+1 dado por 

x 



F{x) = 



r 



para un r > 0. Sobre los puntos de la esfera de centro 0 y radio r coincide con 
el vector normal unitario de la misma, luego Fn = 1. Así pues, el teorema de 
la divergencia nos da que el área de la esfera vale 

f da = f Fndu = í div F dm = í - + - dm = (n + l)v n+í r n = cr n r n , 
Js Js Jb Jb r 

donde B es la bola de centro 0 y radio r y v n+í es el volumen de la bola unitaria 
de dimensión n + 1. Obtenemos de nuevo la relación <r n = (n + l)v n+ \, que ya 
habíamos obtenido en el capítulo anterior. ■ 



10.4 Aplicaciones del teorema de Stokes 

El rotacional en hidrodinámica El teorema clásico de Stokes nos da una 
interpretación importante del rotacional en hidrodinámica. Supongamos que 
V es el campo de velocidades de un fluido tal y como considerábamos en el 
capítulo anterior. Supongamos que en su seno situamos una pequeña rueda que 
pueda girar en torno a un eje fijo. Formalmente, sea S un disco cerrado de 
centro p y radio r (contenido en el dominio de V, o sea, en R 3 , con cualquier 
inclinación). Sea C la circunferencia que lo bordea y sea n un vector unitario 
normal al mismo. 

Dado e > 0, existe un entorno U de p tal que |(rot V){p)n — (rot V)(x)n\ < e 
para todo x £ U. Si tomamos r suficientemente pequeño para que la rueda esté 
contenida en U, entonces 

((rotV)(p)n- e)irr 2 < / (rot F)n da < ((rot V){p)n - e)nr 2 . 
JS 

Por otra parte, vimos en el capítulo anterior que 

V dr = 2irr 2 uj r , 

donde uj r es la velocidad angular que el fluido transmite a la rueda. Aplicando 
el teorema de Stokes llegamos a que 

|(rotV0(p)n-2w r | < e, 

para todo r suficientemente pequeño, es decir, 

(rot V)(p)n = 2 Km iv r . 

i — »o 

Así pues, la velocidad angular que adquirirá la rueda es (aproximadamente) 
la mitad de la proyección del rotacional sobre el eje de giro. Claramente el 
rotacional indica la dirección en que hemos de situar el eje para que la velocidad 
de rotación sea máxima. ■ 
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La ecuación de continuidad Sea V el campo de velocidades de un fluido 
y sea p su densidad (ambos dependen de la posición y del tiempo). Sea p un 
punto cualquiera y S una esfera de centro p. En el capítulo anterior vimos que 
el flujo del campo A = pV a través de S se interpreta como la masa de fluido 
que sale de S por unidad de tiempo. La cantidad de fluido contenida en S en un 
instante dado es la integral de p sobre la bola B de frontera S, luego la variación 
de esta masa es 

d dtL pdm =Lft dm - 

Sea r el radio de B y 



Vv(p) = 7~ñ\ ( í ^E7 dm + í divAdm 
™( B ) \Jb dt J B 

Así, ip r (p)m(B) es el aumento de la masa de fluido en B por unidad de 
tiempo menos la cantidad de masa que entra en B a través de S por unidad de 
tiempo. Por consiguiente tp r (p) es la cantidad de masa que se crea en B por 
unidad de tiempo y de volumen (la masa que aparece en B sin entrar por su 
frontera). El mismo argumento que hemos empleado en la interpretación del 
rotacional nos da ahora que 

dp 

tp(p) = lím Vv(p) = -wt(p) + dívA(p), 

donde ip(p) representa la cantidad de fluido que se crea alrededor de p por unidad 
de tiempo y de volumen. La ecuación 

divA = ip-^. (10.4) 

se denomina ecuación de continuidad de la hidrodinámica, y expresa la conser- 
vación de la masa. 

Los puntos donde i¡> > 0 se llaman fuentes (son puntos donde aparece fluido) 
y los puntos donde ip < 0 se llaman sumideros (en los cuales desaparece fluido). 

Si p es constante el fluido se llama incompresible y entonces la ecuación 
fundamental se reduce a que pdivV en un punto p es igual a la cantidad de 
fluido que se crea alrededor de p por unidad de masa y de volumen. 

Si no hay fuentes ni sumideros la conservación de la masa se traduce en la 
ecuación div V = 0. ■ 

La ecuación de Euler Veamos ahora la versión hidrodinámica de la segunda 
ley de Newton. Recordemos que ésta afirma que F = ma, donde F es la fuerza 
total que actúa sobre un cuerpo de masa ra y a es la aceleración del mismo. 
Vamos a aplicarla a un elemento infinitesimal de fluido. Si llamamos V(x,t) a 
la velocidad del fluido en el punto x y en el instante t, entonces una partícula 
de fluido sigue una trayectoria X(t), de modo que X'(t) = V(X(t),t). La 
aceleración a{x 1 t) será 

, , vllls dV dVdx dVdy dV dz dV ,„ T „ Tr 
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(Se entiende que W se toma respecto a (x, y, z), pero no respecto a t). 

La segunda ley de Newton para el elemento de fluido es dF = padm, donde 
dm es el elemento de volumen y p la densidad, de modo que p dm es el elemento 
de masa. Si fl es un volumen de fluido se ha de cumplir 



P 

n 



dV \ 

+ (VV)V) dm, 



donde F es la fuerza total que actúa sobre íi. Podemos descomponer esta fuerza 
en dos partes. Por un lado tenemos la fuerza exterior que actúa sobre el fluido 
(por ejemplo la gravedad), cuya intensidad por unidad de masa representaremos 
por G, es decir, la fuerza exterior que actúa sobre es J Q pG dm. 

Además sobre fl puede ejercerse una presión. Esta puede deberse al fluido 
circundante, al recipiente (que impide que el fluido se derrame), a la presión 
atmosférica (si el recipiente está abierto por la parte superior), etc. Una carac- 
terística de la presión es que se ejerce en todas direcciones. Más precisamente, 
la presión que el fluido ejerce sobre un cuerpo sumergido en el mismo (o sobre 
una porción del propio fluido) actúa en cada punto perpendicularmente a su 
superficie y hacia el interior. Si llamamos p (magnitud escalar) a la intensi- 
dad de la presión por unidad de superficie, entonces la presión total sobre V es 
— J s pn da, donde S es la superficie que limita a í¿ y n es el vector normal a S 
que apunta hacia fuera de fl. La componente ¿-ésima de esta integral es el flujo 
del campo pe¿. Por el teorema de la divergencia equivale a la integral en fl de 
la derivada de p respecto a x¿, y al reunir las tres igualdades queda 



— / pnda = — / Vpdm. 
Js Ja 



Tenemos, pues 



/ p {% + ( w ) y ) dm= l padm ~ j ^ pdm - 

Como esta igualdad ha de darse para todo volumen fl, necesariamente los 
integrandos han de ser iguales, es decir, 

dV 1 
— + W )V = G - - Vp. 
ot p 

Esta es la ecuación de Euler, que expresa la conservación de la cantidad de 
movimiento de un fluido. 

Por ejemplo, si el fluido está en reposo, su densidad es constante y está 
sometido a un campo gravitatorio dirigido hacia abajo y de intensidad constante 
g, entonces la ecuación de Euler se reduce a 

Vp = -pge 3 , 



de donde se sigue fácilmente que p = pgh, donde h es la profundidad en el fluido 
(suponiendo que la presión en la superficie es nula) . 
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Ejercicio: En las condiciones anteriores, Probar que un cuerpo sumergido en un fluido 
experimenta un empuje hacia arriba igual al peso del fluido que desplaza (principio de 
Arquímedes) . 

Veamos una aplicación de la ecuación de Euler. Sea C una curva cerrada 
contenida en el fluido. Sea X{u) una parametrización. Sea X(u,t) la posición 
en el instante t de la partícula de fluido que en un instante ío estaba en X(u), 
es decir, X(u, t 0 ) = X(u) y la derivada de X respecto de t es V(X(u, t),t). Sea 



Como C es una curva cerrada, la segunda integral es nula. En la primera 
aplicamos la ecuación de Euler: 



Si suponemos que el campo de fuerzas exteriores es conservativo, entonces 
la integral de G a lo largo de C es nula y queda 



Finalmente, si suponemos que la densidad en cada punto y en cada instante 
depende sólo de la presión, la última integral es nula (si f(p) es una primitiva 
de l/p(p) entonces el integrando es df). Con esto hemos probado: 

Teorema de Lord Kelvin En un fluido sometido a un campo de 
fuerzas conservativo y en el que la densidad en cada punto e instante 
dependa sólo de la presión, la circulación de la velocidad a lo largo de 
cualquier curva cerrada permanece constante cuanto ésta se desplaza 
siguiendo la trayectoria del fluido. 

m 

El gradiente de un campo escalar tiene una interpretación muy simple que 
no requiere el teorema de Stokes: dado un campo escalar 0 en IR™ y un punto p 
donde V</>(p) ^ 0, entonces para cada v € IR™ de norma 1 tenemos que 



donde a es el ángulo entre v y Vcf>{p). Esta cantidad es, por otra parte, el 
aumento que experimenta </> por cada unidad que nos desplazamos en la dirección 
de í; y obviamente se hace máxima cuando v tiene la misma dirección y sentido 
que V<p(p). Por consiguiente V0 indica en cada punto la dirección en la que <¡> 
crece más rápidamente. 




Entonces 






d<f>(p)(v) = W4>{p)v = \\V<f>(p)\\ cosa, 
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Definición 10.16 Sea 0 : U — > IR un campo escalar en un abierto de M™. Se 
llama laplaciano de ^ a 

Si 5 es una variedad n — 1-dimensional orientable contenida en í/ y n es su 
vector normal, se define la derivada direccíonal de <f) respecto a n como 

(Notar que efectivamente se trata de la derivada direccional de <¡> en el sen- 
tido usual y en la dirección que marca n.) Aplicando a el teorema de la 
divergencia obtenemos: 

Teorema 10.17 Sea V C K" una variedad compacta de dimensión n contenida 
en un abierto U. Sea <p : U C R™ — > R un campo escalar. Entonces 

í A<p dm = í ^ da, 
Jv Jov dn 

donde n es el vector normal a dV que apunta hacia fuera de V. 

En otras palabras, el flujo del gradiente de un campo a través de una su- 
perficie cerrada es igual a la integral de su laplaciano sobre el recinto que ésta 
encierra. Esto nos relaciona el laplaciano con los campos conservativos, que se 
expresan como gradientes de campos escalares. 

El campo gravitatorio Consideremos de nuevo el campo gravitatorio gene- 
rado por un cuerpo puntual de masa M situado en un punto y. Sabemos que 
su intensidad (es decir, la fuerza que ejerce por unidad de masa) viene dada por 
la ley de Newton: 

E{x) = -W=W {x ~ y) ' 

suponiendo al cuerpo en el origen de coordenadas, y que ademas puede expre- 
sarse de la forma E = — VV, donde 

V{x) = -jj ir- 

\\x-y\\ 

Un cálculo elemental muestra que AV = div E = 0. Esto significa que el 
flujo de i? a través de una superficie cerrada S que rodee a un punto dado y no 
contenga a y es nulo (es la integral del laplaciano de V). No ocurre lo mismo 
si la superficie contiene a y en su interior (notar que si y está en S el flujo no 
está definido). En efecto, en tal caso podemos tomar una bola B de centro y 
contenida en la región G rodeada por S. Entonces G \ B es una variedad con 
frontera, la cual es igual a S U dB. La orientación positiva en S es la misma 
respecto a G y respecto a G\ B, mientras que la orientación positiva en dB 
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como parte de la frontera de G \ B es la dada por el vector normal que apunta 
hacia dentro de B, es decir, la opuesta a su orientación positiva como frontera 
de B. El teorema de Stokes nos da que el flujo de E por la frontera de G \ B 
es nulo, luego el flujo a través de S es igual al flujo a través de dB. Por otra 
parte, el campo E es normal a dB, de módulo constante sobre la superficie y 
apunta hacia el interior, luego dicho flujo es 

$ = -\\E\\m(dB) = — -j- 4nr 2 = -4nGM, 

donde r es el radio de B. 

Resulta orientador pensar en el campo gravitatorio generado por una masa 
puntual M como si fuera el campo de velocidades de un fluido incompresible. 
El hecho de que el flujo a través de las superficies cerradas que contienen a y sea 
— AtiGM se interpreta como que tales superficies "se tragan" una cantidad de 
fluido proporcional a M. No podemos decir con propiedad que y sea un sumidero 
en el sentido que dimos a este término, pues sobre él no está definido el campo, 
pero esto más bien debe llevarnos a pensar que dicha definición de sumidero es 
demasiado particular, y que debemos admitir como tales a los puntos alrededor 
de los cuales desaparece fluido en el sentido que acabamos de ver. 

Por otra parte, donde no hay masa la divergencia del campo es nula y, 
efectivamente, no se crea ni se destruye fluido (el flujo es nulo). 

Todo esto se generaliza de forma inmediata al caso del campo producido por 
n partículas puntuales de masas Mi, . . . , M n . Basta aplicar el principio de su- 
perposición, en virtud del cual la fuerza que estas masas ejercen sobre un cuerpo 
dado es la suma de las fuerzas que cada una de ellas ejercería por separado. Es 
claro entonces que el potencial del campo es la suma de los potenciales asociados 
a cada uno de ellos. El flujo a través de una superficie cerrada es igual a — AnG 
por la suma de las masas que contiene. 

Los modelos de masas puntuales son válidos para estudiar el movimiento de 
los planetas, pero no sirven para dar cuenta, por ejemplo, de la interacción entre 
la Tierra y los objetos próximos a ella. En tal caso debemos tener en cuenta la 
forma geométrica del espacio que ocupan las masas. En lugar de tener uno o 
varios puntos de masa tenemos una medida que asigna a cada región del espacio 
la masa que contiene. Si admitimos que una región de volumen 0 no puede 
contener masa (es decir, negamos la existencia de masas puntuales) entonces 
dicha medida estará determinada por una función de densidad p, de modo que 
la masa contenida en un volumen V vendrá dada por 

M = pdm. 
Jv 

Para calcular una aproximación de la intensidad del campo gravitatorio gene- 
rado por la distribución de masas p en un punto x podemos dividir el espacio 
en regiones pequeñas de volumen pdm, calcular la intensidad correspondiente 
a esta masa y sumar las fuerzas así obtenidas. Con ello estamos calculando una 
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aproximación de la integral 

donde V es un volumen que contiene a toda la masa que influye (el dominio de 
p) y la integral de una función vectorial se interpreta como el vector formado 
por la integral de cada componente. Esta debe ser la expresión exacta de la 
citada intensidad del campo. Un razonamiento similar con los potenciales nos 
lleva a que el potencial gravitatorio en el punto x debe ser 



No obstante, todo esto nos plantea varios problemas. En primer lugar hemos 
de justificar que las integrales existen, pues si x € V el integrando tiende a 
infinito en x. Por otra parte no es evidente que estas funciones cumplan E = 
— VV, que es la relación que debe darse para que V sea una función potencial 
de E. Los resultados que vamos a obtener pueden darse en un contexto general: 

Definición 10.18 Sea fl C K™ (con n > 3) un abierto acotado y / una función 
medible acotada en íl. Llamaremos potencial newtoniano asociado a / a la 
función 



V f( x ) = / Ti —¡T n -2 dm (í/)> paraxG 

Ja \\ x - y\\ 



El teorema 9.23 garantiza que el integrando es realmente integrable en Í2, 
por lo que Vj está bien definido. Sea g(x,y) = \\x — y\\ 2 ~ n - Es claro que g es 
de clase C 1 en (IR™ \ Í2) x fl, luego el teorema 7.23 nos garantiza 2 que V¡ es de 
clase C 1 en R™ \ Q y sus derivadas valen 



(x) = -(n - 2) f f{y) ( Xi - y>) dm(y), (10.5) 

Jq \\ x — y\\ 



Vamos a probar que esta expresión vale igualmente en fl. Por lo pronto 
observemos que el integrando del segundo miembro es ciertamente integrable. 
Basta tener en cuenta que 

\%í y i 



2/11 



< 1, 



con lo que el integrando está mayorado por la función integrable K/\\x — y|| n_1 . 
Para cada natural k > 1 consideremos la función a k : [0, +oo[ — > E dada 

por 

f 1 n-2 , 1, . 

i o + i T( r -Tl si r < 1/k 

a k {r) = { k n - 2 k n ~ 3 v k> 1 

r n ~ 2 si r > í/k 



2 Admitimos que dfl es nula, luego la integral puede tomarse en el compacto Q. 
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Claramente es de clase C 1 en su dominio y además no se anula, pues la 
derivada es positiva en [0, l/k]. Definimos las funciones 



La función ük(\\x — í/||) _1 es de clase C 1 en I™ x 1", por lo que podemos 
aplicar el teorema 7.23. 

Si probamos que las funciones Vk convergen uniformemente a V¡ y sus de- 
rivadas convergen al segundo miembro de (10.5), el teorema 3.28 nos dará que 
dicha igualdad es válida en todo punto. 

Puesto que los integrandos de Vf(x) y Vk(x) difieren sólo sobre B\/k{x), 
tenemos que 



La última integral, como función del dominio de integración, es una me- 
dida finita en ¿?i(0) por el teorema 7.17, luego el último miembro tiende a 0 
con k, por el teorema 7.2. Esto prueba la convergencia uniforme de Vk- El 
mismo argumento vale para las derivadas. Observar que no es necesario calcu- 
lar explícitamente la derivada del integrando de Vk- Basta tener en cuenta que 
consta de f(y) multiplicada por una función continua, luego integrable. 

Notemos que las derivadas de Vf en los puntos de Í7 son el límite uniforme 
de una sucesión de funciones continuas (las derivadas de Vk), luego Vf es una 
función de clase C 1 en W 1 . 

En particular tenemos que el campo y el potencial gravitatorio determinados 
por una distribución de masa p están bien definidos y satisfacen la relación 
E = — VV, como ha de ser. 

Sigamos en el caso general y vamos a calcular el laplaciano de Vf. El teorema 
7.23 nos permite concluir directamente que Vf es de clase C°° en IR™ \ fl. Más 
aún, es fácil comprobar que A x g = 0, con lo que también AVf = 0. Para 
los puntos de Í7 no podemos emplear la misma técnica que hemos usado para 
calcular las primeras parciales, pues las derivadas segundas del integrando no 
son integrables. 

Consideremos un punto x n € fl tal que / es de clase C 1 en una bola 
B 2e (x 0 ) C íl 

Descomponemos Vf = Vi + V 2 , donde ambos sumandos tienen la misma 
definición que Vf salvo que el dominio de integración es B € (xo) en el caso de Vi 
y \ B € (xo) en el caso de V 2 . 

Es claro que V 2 es de clase C 2 en B e (xo). Sus parciales segundas se pueden 
calcular derivando el integrando. Además AV¿ = 0. Por lo tanto para probar 
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que Vf es de clase C 2 en B e (x 0 ) basta probar que lo es Vi, y además tendremos 
AVf(x 0 ) — AVi(xo). Ya sabemos que 

d k {x) = Lj iy) k{¥^\\^) dm{y) 
= -k { J {y) k{¥^\^ dm{y) 



,(x 0 ) V% \\\ x - y\\ n V Ik-yll" 2 9y 

La integral del segundo término es el potencial newtoniano de la derivada 
de /, luego sabemos que tiene derivada continua y viene dada por 

Nos ocupamos ahora del otro término. Aplicamos el teorema de la divergen- 
cia al campo F dado por 

^iy) h ir»)— 2 e¿ ' 

11^ — 2/11 

donde e¿ es el z-ésimo vector de la base canónica. La divergencia de F es nuestro 
integrando y su flujo a través de la esfera de radio e (precedido del signo negativo 
de nuestra integral) es 

- L ÁX0) w^\^ ein{v)da{vl 

donde n es el vector unitario normal a la esfera y da es el elemento de medida 
de la esfera. A esta integral también le podemos aplicar 7.23, con lo que tiene 
derivada continua respecto ai,y viene dada por 



(n 



2) / ñfi^(xi-yi)eMy)My)- 
JdB € (x 0 ) \\ x ~ y\\ 



En este punto ya tenemos que Vi es de clase C 2 en B £ (x 0 ). Teniendo en 
cuenta que n(y) = (y — x 0 )/\\x 0 — y\\, al particularizar en xq tenemos en total 



d 2 V, f f{y){x 0l - yi ) 2 



'Be(xo) 

Por consiguiente: 



AV f (x 0 ) = AVM = j f(y)da 
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Como el miembro izquierdo no depende de e, podemos tomar el límite cuando 
e tiende a 0. El último sumatorio tiende a 0, luego queda 

AV f (x 0 ) = -(„ - 2) lím / f(y) da. 

£ ^ 0e JdB e (x 0 ) 

Llamemos u n -\ a la medida de OBi(0). Entonces la medida de dB € (x 0 ) es 
e n ~ x a n - x . Así 



"TPi / f(y)da-a n - 1 f(x 0 ) = — ^ í f(y)-f(x 0 )da 

- JdB t (x„) e JdBJxo) 

<~^í i \f(y)-f(x 0 )\da. 
e " JdBAx 0 ) 

Dado r¡ > 0, existe un <5 > 0 de manera que si \\y — a;o|| < 5 entonces 
\f(y) ~ f( x o)\ < v/ a n-i- Para todo e < <5 la expresión anterior está acotada 
por rj, luego concluimos que AV/(xo) = — (n — 2)o"„_i/(xo). 

Si extendemos / a E" con el valor 0 fuera de fl, hemos probado que V¡ es 
de clase C 2 allí donde / es de clase C 2 (lo cual incluye a todos los puntos de 
M n \íi) y en tales puntos AV¡ = — (n — 2)cr n -i/- El análisis que hemos hecho de 
las parciales de V¡ puede usarse inductivamente para probar que si / es de clase 
C k alrededor de un punto, lo mismo vale para Vf. Resumimos en un teorema 
lo que hemos obtenido: 

Teorema 10.19 Sea fl un abierto acotado en IR™, para n > 3, y sea f una 
función medible acotada que se anula fuera de fl. Entonces el potencial newto- 
niano 

V >( x )= / II iin -2 dm (y)' ParaxeR n 

Jn \\ x - y\\ 

es una función de clase C 1 en K" y de clase C k en todos los puntos donde f es 
de clase C k . Además 

= -(« - 2) (x y) dm(y), 

y en los puntos donde f es de clase C 2 satisface la ecuación de Poisson asociada 
a f , es decir, AVf = — (n — 2)er„_ 1 /, donde er„_i es la medida de la esfera 
unitaria de dimensión n — 1. 

Ejercicio: Probar un teorema análogo para n = 2 definiendo 

Vf( x ) = fiv) log \\x -y\\dy. 
Jn 

Si n = 3 queda AVf = —Anf. En particular, si V es el potencial gravitatorio 
generado por una distribución de masa p, entonces AV = AnGp. Equivalente- 
mente, si E es la intensidad del campo, se cumple div E = —AnGp. En este caso 
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podemos decir con propiedad que los puntos donde hay masa se comportan como 
sumideros de un "fluido gravitatorio" . Además tenemos un importante teorema 
de Gauss: 

El flujo del campo gravitatorio a través de una superficie cerrada que 
encierra una masa M es igual a —AttGM. 

Por ejemplo, sea B una esfera homogénea de densidad p y radio R. Es fácil 
ver que el campo gravitatorio que origina tiene simetría esférica, es decir, 

A"(||a;||) 
E[x) - ¡j^y-s. 

para una cierta función K. Consideremos una superficie esférica 5* cuyo centro 
coincida con el de i? y de radio r < R. El flujo de E a través de S es — 4irr 2 K(r), 
luego por el teorema de Gauss 

-Airr 2 K{r) = -AnGp ^nr'-\ 

ó 

En definitiva, 

AttG P GM 
E( X ) = -— X =-— X . 

Si tomamos r > R entonces queda — Anr 2 K(r) — —AttGM, luego 

es decir, el campo generado por la esfera en un punto exterior a la misma coincide 
con el que generaría una masa puntual situada en su centro. ■ 



La ecuación del calor La materia, en cualquiera de sus estados, está com- 
puesta de partículas diminutas, sean partículas subatómicas sueltas, átomos con 
enlace metálico o moléculas con diferentes estructuras. En todos estos casos, di- 
chas partículas tienen una cierta libertad de movimiento y a nivel microscópico 
pueden moverse a velocidad considerable. Esta velocidad no puede medirse di- 
rectamente, pero la velocidad media de las partículas de un cuerpo determina lo 
que llamamos su temperatura T. Por otra parte, la suma de la energía cinética 
de cada partícula es lo que llamamos la cantidad de calor Q del cuerpo (y se 
mide en Julios, como corresponde a la energía). Puesto que T es un promedio de 
velocidades, ya no es cierto que Q sea proporcional al cuadrado de T, sino que 
la experiencia establece que la proporción es lineal y la constante depende de las 
características químicas de cada sustancia. Concretamente cada sustancia tiene 
asociado un calor específico c, de modo que la cantidad de calor de un cuerpo 
de masa m, calor específico c y temperatura T es Q = mcT. 

Aquí suponemos que T y c son constantes. Si c y T dependen de la posición 
entonces Q = J v cpTdm, donde p es la densidad del cuerpo (función de la 
posición) y dm es el elemento de volumen (no de masa) . Por consiguiente cpT es 
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la densidad de calor de un cuerpo de calor específico c, densidad p y temperatura 
T. Podemos suponer que c y p sólo dependen de la posición, mientras que Q 
y T dependerán también del tiempo, y se plantea el problema de determinar 
esta dependencia, esto es, de determinar la forma en que se transmite el calor a 
través de un cuerpo. 

El modelo más simple al respecto postula que el calor es como un fluido 
que se mueve hacia el punto más frío posible, es decir, teniendo en cuenta el 
ejemplo en el que hemos introducido la ecuación de continuidad así como la 
interpretación del gradiente: A = — fcVT, donde k > 0 es una constante. La 
ecuación de continuidad (10.4) se convierte en este caso en 

dT 

kAT + i> = cp— , 
ot 

donde tp refleja las fuentes y sumideros de calor. Esta ecuación se conoce como 
ecuación del calor. m 



10.5 Las fórmulas de Green 

Vamos a deducir varias fórmulas clásicas a partir del teorema de Stokes. 
Partimos de dos funciones f,g : U — > R de clase C 2 en un abierto U C R n . 
Una simple comprobación nos da la identidad 

dw(gVf) = VfVg + gAf. 

Sea V C U una variedad compacta orientable de dimensión n contenida en U. 
Aplicando el teorema de la divergencia obtenemos la llamada primera fórmula 
de Green: 

J gAfdm + J VgVfdm = J g^da, 

donde da es el elemento de medida en dV y n su vector normal. Intercambiando 
los papeles de / y g y restando las fórmulas correspondientes obtenemos la 
segunda fórmula de Green: 

Supongamos n > 3, fijemos un punto x interior &V y apliquemos la fórmula 
anterior a la función g{y) = l/\\x — y\\ n ~ 2 y a la variedad V e que resulta de 
quitarle a V una bola abierta de radio e suficientemente pequeño para que esté 
contenida en V. Observamos que Ag = 0. En efecto: 

dg , „s Xi-yi dg 2 n-1 (ar¿ - y t ) 2 



(n — 2) ^ — -^ = - Tl n-+n(n-2) „ ., 



% " \\x-y\\ n ' dyf \\x-y\\ n ' ' \\x - y 



y al sumar sobre i queda 0. Si llamamos S e a la esfera de centro x y radio e la 
fórmula de Green nos da que 
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Jv e \\ x ~y\\ n 2 Jav\\\ x -y\\ n 2 dn dn\\x-y\\ n 2 

+ j Sr ( f dn~\\x-y\\ n - 2 ~ \\x-y\\ n - 2 dñ) 

Observar que hemos cambiado el signo en el segundo integrando porque la 
orientación positiva de S es la contraria a la que tiene como parte de la frontera 
de V e . Puesto que / es de clase C 2 , tenemos que A/ es continua en V , por lo que 
el integrando del primer miembro es integrable en V (es el potencial newtoniano 
de A/), luego existe el límite cuando e — > 0 de ambos miembros de la igualdad, 
luego también del último término. Vamos a calcularlo. 

Notemos que sobre los puntos de S e es n(y) = (y — x)/\\x — y\\, luego los 
cálculos que hemos hecho antes muestran que 

di n-2 



dn \\x — y\\ n 2 \\x — y\\ n 1 
El último término es, pues, 
(n-2) 



Si llamamos cr„_i a la medida de Lebesgue de la esfera unitaria de dimensión 
n — 1, entonces a(S e ) = e™ _1 <r n _i, yes claro que la segunda integral está acotada 
por Ko n -\t, donde K es una cota de la derivada direccional de / en un entorno 
de x. Por consiguiente este término tiende a 0. El límite del primer sumando lo 
calculamos al estudiar los potenciales newtonianos (ver las fórmulas precedentes 
al teorema 10.19). Recordemos que vale — (n — 2)er n _i/(x). Con esto obtenemos 
la tercera fórmula de Green 

+ Lv {W^y\\ n - 2 di ~ f dn"F^|«- 2 ) My) ) • 

Esta fórmula nos dice que el valor de una función de clase C 2 en un punto 
x está completamente determinado por A/ en un entorno de x y las funciones 
/ y df /dn sobre una superficie que rodee a x. Hay un caso particularmente 
interesante donde esta expresión se simplifica mucho: 

Definición 10.20 Se dice que una función / de clase C 2 es harmónica en un 
abierto V si cumple Af(x) = 0 para todo x € V. 



Por ejemplo, el potencial newtoniano de una función / es una función harmó- 
nica en los puntos exteriores al soporte de /. 
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La tercera fórmula de Green para una función harmónica / se reduce a 



I[X) {n-2)a n .J dv {\\x-y\\^ dn f dn \\x - y\\»-* ' 



donde V es un abierto en IR™ cuya clausura sea una variedad compacta y en el 
cual / sea harmónica (con n > 3). 

Esta fórmula nos dice en principio que una función harmónica f en V está 
completamente determinada por los valores que / y df /dn toman sobre dV. 
Podemos ir más lejos y concluir que una función harmónica en V está comple- 
tamente determinada por los valores que toma en dV . En efecto, supongamos 
que /i y ¡2 son funciones continuas en V, harmónicas en V y que coinciden 
en dV . Entonces la función h = fi — fi es harmónica en V y se anula en dV. 
Aplicando la primera fórmula de Green a las funciones / = g = h resulta 

/ ||V/i|| 2 dm = 0 
Jv 

y, como el integrando es positivo, ha de ser V/i = 0 en V, lo que implica que h 
es constante en V y, como se anula en dV, ha de ser h = 0, es decir, /i = / 2 . 

Si suponemos ahora que V es la bola de centro x y radio r, entonces la 
tercera fórmula de Green para una función harmónica nos da que 

f(x) = 7T, — — / -7- da H / f da, 

J 1 ' r n - 2 (n - 2K_x J 9V dn r"" 1 ^ J 9V J 

Por el teorema de la divergencia 

f ^-da= í Vfnda= f Afdm = 0, 
Jdv dn J dv J v 

luego se cumple el llamado teorema del valor medio de Gauss: 

= í»o i \\ í f d(J - 
a{dB r {x)) J dBr(x) 

Esta fórmula afirma que el valor que toma una función harmónica en un 
punto x es la media aritmética de los valores que toma en cualquier esfera con 
centro en x. De aquí se sigue fácilmente que una función harmónica no puede 
tomar valores máximos o mínimos en ningún abierto en el que esté definida. 
También es claro que si una función harmónica tiende a una constante en oo 
entonces es constante. 



Ejemplo Si /, g : IR™ — > IR, usaremos la notación / = O(g) para indicar que 
existen constantes M y R tales que si ||x|| > R entonces |/(a;)| < M\g{x)\ (se 
dice entonces que / es una función del orden de g). 

Si / : IR™ — > IR es una función de clase C 2 con soporte compacto, donde 
n > 3, es fácil ver que su potencial newtoniano Vf cumple Vf — 0(l/||a;||™~ 2 ) 
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y ||W/|¡ = 0(l/|jx|j™ _1 ). Por ejemplo, en el caso de la gravedad esto significa 
que el campo gravitatorio se atenúa en proporción inversa al cuadrado de la 
distancia. Además sabemos que satisface la ecuación AV¡ = —(n — 2)a n -\f. 
Vamos a probar que V¡ es la única función que cumple estas condiciones. 
Supongamos que u : R™ — > K es una función de clase C 2 tal que 

« = 0(1/11x11), ||V^|| = 0(l/||a;|| 2 ), Au = -(n - 2)a n ^f. 

Veamos que necesariamente u — Vf. Basta aplicar la tercera fórmula de Green 
a la bola B r de centro O y radio r: 

u{x) = í V ,, 2 dm{y) 

JB r \\ x - y\\ 

1 f f 1 du d 1 

(n - 2)a„_i J 9Bt \ \\x - y\\ n - 2 dn dn \\x - y\ 

Si r es suficientemente grande como para que se cumplan las estimaciones de 
u y Vií que estamos suponiendo, el módulo del integrando del último término 
está acotado por K/r n , luego la integral está acotada por K' /r, luego tiende a 
O cuando r tiende a +oo. Consecuentemente 

= í jj ., 2 dm{y). 

Jr- \\x-y\\ n 1 

El dominio de integración se puede reducir a cualquier abierto que contenga 
al soporte de /. Así pues, u—V¡. ■ 

Ejercicio: Deducir la tercera fórmula de Green y sus consecuencias para el caso en 
que n = 2, tomando para ello g(y) = log ||:r — y\\ en lugar de ||a; — y\\ 2 ~ n . 




10.6 El teorema de Stokes con singularidades 

Observemos que el teorema de Stokes para un cubo (teorema 

10.12) no es un caso particular del teorema de Stokes generali- * ' 

zado, pues un cubo no se ajusta a la definición que hemos dado 
de variedad con frontera (a causa de sus aristas). El hecho de 
que el teorema de Stokes valga para cubos hace sospechar que 

vale para variedades (en algún sentido de la palabra) más gene- 

rales que las que estamos considerando aquí. Efectivamente, es frecuente que 
en aplicaciones a la física se haga uso del teorema sobre — por ejemplo — un 
cilindro de altura finita, que tampoco es una variedad con frontera a causa de 
las dos circunferencias que bordean sus "tapas" . Podríamos considerar como va- 
riedad con frontera al cilindro menos dichas circunferencias, pero esto no ayuda 
en mucho, pues si tenemos una 2-forma definida en un entorno del cilindro su 
restricción al cilindro menos las circunferencias no tiene necesariamente soporte 
compacto (y nos gustaría, pese a ello, justificar la fórmula de Stokes en este 
caso). Conviene introducir algunos conceptos. 
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Definición 10.21 Sea S C M™ una variedad de dimensión n sin frontera. Sea 
F(S) = S \ S. Diremos que un punto p G F(S) es un punto frontera regular 
de S si existe una carta X : U — > V de R n alrededor de p (de coordenadas 
Xi, . . . ,x m ) de modo que S H V está formado por los puntos de coordenadas 
x n+ \ = ■ ■ ■ = x m = 0, x n < 0, mientras que los puntos de F(S) fl V son los de 
coordenadas x n = x n+ \ = ■ ■ ■ = x m = 0. Llamaremos dS al conjunto de puntos 
frontera regulares de S. 

Obviamente S U dS es una variedad con frontera. El conjunto F(S) \ dS es 
cerrado en R m . Sus puntos se llaman puntos frontera singulares. 

Por ejemplo, si S es un cilindro abierto en IR 3 , sus puntos frontera singulares 
son los de las dos circunferencias que limitan sus tapas. Nuestra intención es 
probar el teorema de Stokes para una variedad S cuyos puntos frontera singu- 
lares formen un conjunto pequeño en el sentido de la teoría de la medida. A 
su vez, la idea es modificar cada forma en un entorno suficientemente pequeño 
del conjunto de puntos singulares para hacer aplicable el teorema de Stokes que 
conocemos y después hacer un paso al límite. 

Una sucesión fundamental de entornos de un cerrado E C M. m es una familia 
de abiertos {W^};*^ que contienen a E tal que si V es un abierto y E C V, 
entonces Wk C V para todo k suficientemente grande. 

Supongamos que E es el conjunto de puntos singulares de una variedad S 
y que {M 7 *:})*^ es una sucesión fundamental de entornos de E. Para cada k, 
tomemos una función g^ que se anule en un entorno de E y valga 1 fuera de Wk- 
De este modo, si tu es una n — 1-forma definida en un entorno de S, la forma gkto 
coincide con w salvo en Wk y tiene soporte compacto en SU dS, luego podemos 
aplicarle el teorema de Stokes: 

/ g k u= / d(g k uj) = g k duj+ dg k A u. (10.6) 
JdS Js Js Js 

El paso siguiente es tomar límites cuando k tiende a infinito, y el punto más 
delicado es estudiar el comportamiento del último término. Recogeremos en una 
definición todo lo que necesitamos: 

Definición 10.22 Sean E y S subconjuntos cerrados de K m . Diremos que E 
es despreciable para S si existe un abierto W en M™ que contiene & E y una 
sucesión fundamental de entornos de E tales que Wk C W y una 

sucesión {gkJ'kLi de funciones de clase C 1 en W tales que 

a ) 0 < <7fc < 1 , gk se anula en un entorno de E y vale 1 fuera de Wk ■ 

b) Si u) es una n — 1-forma de clase C 1 en W, entonces dgk A o; es integrable 
en W fl S y, si llamamos fik a la medida signada en S definida por su 
integral, entonces 

\fm\li k \(WnS)=0. 

k 

Con esta definición es fácil probar: 
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Teorema 10.23 Sea S C R m una variedad de dimensión n sin frontera. Sea 
u) una n — 1 -forma de clase C 1 en un abierto de R m que contenga a S y tal que 
la intersección con S del soporte de w sea compacta. Supongamos: 

a) Si E es la intersección del conjunto de puntos frontera singulares de S con 
el soporte de u>, entonces E es despreciable para S. 

b) Las formas duj en S y w en dS son integrables. 
Entonces 

LO. 



í du= j 

JS Jd 



dS 

Demostración: Sean W, {Wk}f =1 y {gk}^Li según la definición de con- 
junto despreciable. Notar que las funciones gk se pueden considerar definidas 
en M. m . Entonces g k oj es nula en un entorno de E, de donde se sigue fácilmente 
que el soporte de su restricción a S U dS es compacto. Aplicando el teorema de 
Stokes a esta variedad con frontera obtenemos (10.6). Ahora notamos que 



/ (j - / g k uj = / (1 - g k )w < 
Jas Jas Jas Jw 



>w k nas 



d\n u \ = \ f i u \(w k ndS), 



donde /i w es la medida definida por la integral de lo. Puesto que la intersección 
de los conjuntos W k fl dS es vacía y las medidas son finitas, el teorema 7.2 nos 
da que 



lím / g k uj = / í 
k Jas Jas 



(Podemos suponer que los conjuntos W k son decrecientes.) Igualmente se llega 
a que 



lím 



/ g k du) = 
Js Js 



du. 



Finalmente: 



dgh A ío 



< 



d|wfe| = \ii k \{Wf\S), 



snw 



y por la definición de conjunto despreciable el último término tiende a 0. To- 
mando límites en (10.6) obtenemos la fórmula del enunciado. ■ 

Evidentemente, este teorema es de escaso valor sin una caracterización acep- 
table de los conjuntos despreciables. Es claro que todo subconjunto cerrado de 
un conjunto despreciable para una variedad S es también despreciable. 

Teorema 10.24 Sean E y F dos subconjuntos compactos despreciables para 
una variedad S C W l sin frontera. Entonces E U F también es despreciable. 

Demostración: Sean W, {W/J^, {gk}kLi según la definición de con- 
junto despreciable (para E) y sean W, {Wj í }'%L 1 , {5^}^! los análogos para F. 
Basta tomar 



W" = WUW', W' k ' = W k yjWi g'i = g k g' k . 
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Es claro que estos conjuntos y funciones prueban que EU F es despreciable. 
Para la última condición observamos que 

d (.9k9 k ) Aw = g k dg k Aui + g k dg' k A w. 



Enunciamos el teorema siguiente en el caso en que la variedad S es un abierto 
en IR™ porque es el de mayor interés en la práctica, pero afinando un poco el 
argumento se generaliza a abiertos en variedades arbitrarias. 

Teorema 10.25 Sea S un abierto enR n y E un subconjunto compacto de IR™ 
tal que 3 existe un cubo cerrado Q de dimensión m < n — 2 y una aplicación 
h : U — > IR" de clase C 1 , donde U es un entorno de Q y h[Q] = E. Entonces 
E es despreciable para S. 

Demostración: En primer lugar observamos que podemos suponer que 
m = n — 2, pues en caso contrario la aplicación / se puede componer con la 
proyección desde un cubo de dimensión superior. Así mismo, componiendo con 
una aplicación lineal podemos suponer que Q = [0, 1]™~ 2 

Un sistema fundamental de entornos de E lo forman los conjuntos 

W k = {x e W 1 | d(x,E) < 2/k}, fe = 1,2,... 

Consideramos concretamente la distancia inducida por || ||oo en IR". Tome- 
mos una función <j> : IR™ — > [0, 1] de clase C°° que se anule sobre los puntos con 
II x\ |oo < 1/2 y valga 1 sobre los puntos con HarH^ > 1. Para cada natural k > 0 
sea 4>k(x) — <¡>(kx). Si C es una cota de las derivadas parciales de (¡> en IR™, es 
claro que para todo x € IR™ se cumple ||-D¿</>fe(a;)||oo < kC. Observar que la cota 
C sólo depende de n. 

Sea I = {l € Z™ | d(l/2k,E) < 1/k}. Claramente se trata de un conjunto 
finito. Definimos 

9k(x) = J[<f)k (x- . 

La función g k es de clase C°° . Veamos que se anula en un entorno de E, 
concretamente en el de los puntos a; € IR™ tales que d(x,E) < l/4fc. Dado 
uno de estos puntos x, existe l G Z™ tal que d(x,l/2k) < l/2fc (la coordenada 
U es la parte entera de 2fcr¿). Claramente d(l/2k,E) < l/k, luego l £ I y 
(j) k (x — l/2k) = 0, y en consecuencia gu{x) = 0, como queríamos probar. 

Veamos ahora que g k vale 1 fuera de W k . En efecto, si d(x, E) > 2/k y l £ I, 
es decir, d(l/2k,E) < l/k, entonces d(x,l/2k) > l/k, luego 4> k (x — l/2k) = 1 y 
así g k (x) = 1. 

El motivo de toda esta construcción es garantizar que las funciones g k cum- 
plen una condición adicional, y es que sus derivadas parciales están acotadas 
por C\k, donde C\ es una constante que sólo depende de n. En efecto, tomemos 



3 En el caso n = 2 el teorema se cumple si E consta de un solo punto. Algunos razonamientos 
han de ser sustituidos por otros más simples. 
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un punto x £ IR™ alrededor del cual las derivadas de g k no sean idénticamente 
nulas, lo que implica que \\x — £o/2fc||oo < 1/A para un cierto lo € /. De los 
factores que componen g k , todos serán nulos en un entorno de x excepto a lo 
sumo los correspondientes a vectores l £ I tales que \\x — Z/2fc||oo < 1/fc, pero 
entonces \\l — Zo||oo < 4, y es fácil ver que hay a lo sumo 9™ puntos así. Al derivar 
gk obtenemos una suma de 9™ términos, cada uno de los cuales es un producto 
de la derivada de una función <fik(x — l/2k) por otras funciones de este tipo sin 
derivar. Estas están acotadas por 1 y la primera por Ck, luego cada derivada 
de gk está acotada por C\k, donde C\ es una constante que sólo depende de n. 

Tomando W = M. n tenemos comprobada la condición a) de la definición de 
conjunto despreciable. 

Consideremos ahora una n— 1-forma lo de clase C 1 en IR™. Será de la forma 

n 

lo = fj dx\ A • • • A dxj-i A dXj + \ A • • • A dx n . 

3 = 1 

Entonces dg k A lo = f dx\ A • • • A dx n , donde la función 

n 

/ = £(-i) j+ 7^<? fe 

está acotada por C 2 fc, y la constante C 2 sólo depende de n (las funciones fj se 
acotan en W\). Puesto que / tiene soporte compacto, la n- forma dg^ A lo es 
integrable en IR™ y determina la medida dada por ¡J,k(A) — f A fdm. Entonces 



W\(M n )= / \.f\dm<C 2 km(W k ). (10.7) 

Ahora estimaremos la medida de W k para concluir que la expresión anterior 
tiende a 0 cuando k tiende a infinito. Dividimos el cubo Q en fc™ -2 cubos de 
lado 1/fc. Como las normas en IR™ son equivalentes, la distancia euclídea entre 
dos puntos del mismo cubo está acotada por C¡/k, para una cierta constante k. 
Aplicando el teorema del valor medio a cada función coordenada de h concluimos 
que si u y v están en el mismo cubo, entonces /i(u)||oo < C±/k. Si £ € Wk, 

entonces x dista menos de 2/fc de un punto de E, el cual dista menos de C\/k 
de la imagen del centro de uno de los fc™~ 2 cubos, luego Wk está contenido en 
la unión de fc™~ 2 bolas de radio C^/k (para cualquier norma, por ejemplo la 
euclídea), luego 

2 C 6 _ C 6 



m(W k )<k-^ = ^, 



donde las constantes C3, . . . , Cq dependen de n, / y lo, pero no de k. Conectando 
esto con (10.7) llegamos a que |/zfc|(R n ) < Cr/k, que tiende a 0 con k. m 

En vista de lo anterior tenemos la versión siguiente del teorema de Stokes, 
que incluye como caso particular el de los cubos que ya habíamos probado: 

Teorema 10.26 (Teorema de Stokes con singularidades) Consideremos 
un abierto S en IR™ tal que el conjunto de puntos singulares de su frontera 
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sea unión de un número finito de variedades compactas de dimensión menor 
o igual que n — 2. Sea uj una n — 1- forma definida en un entorno de S tal 
que la intersección con S de su soporte sea compacta y las formas u> y alu; sean 
integrables en S y dS respectivamente. Entonces 



Evidentemente, todas las consecuencias del teorema de Stokes que hemos 
visto en las secciones anteriores valen ahora en el contexto de este teorema. 

10.7 Apéndice: Algunas fórmulas vectoriales 

Aunque el contenido de esta sección no tiene que ver directamente con el teo- 
rema de Stokes, hemos preferido posponer hasta aquí los resultados que siguen 
para exponerlos una vez estamos familiarizados con las principales operaciones 
vectoriales: gradiente, divergencia y rotacional. Los resultados principales serán 
las expresiones de estas operaciones en sistemas de coordenadas distintas de las 
cartesianas, pero antes recogemos algunas fórmulas de interés. 

El operador nabla Muchas fórmulas del cálculo vectorial se recuerdan más 
fácilmente si definimos el "vector" nabla como 



Naturalmente, esto no tiene ningún significado en sí mismo, pero formal- 
mente el gradiente de una función / puede pensarse como el producto del vector 
V por el escalar /, lo que concuerda con la notación V/. Similarmente, la di- 
vergencia de un campo vectorial V puede interpretarse como el producto escalar 
del vector V por el vector V, lo que nos permite escribir también div V = W. 
Por último, el rotacional de V es el producto vectorial de V por V, o sea, 
rot V = V A V. 

En estos términos, las fórmulas siguientes quedan de forma más simétrica: 



Todas ellas se comprueban sin dificultad a partir de las definiciones, aunque 
algunas resultan algo laboriosas. 

Notar que las relaciones rotgrad/ = 0, div rot y = 0 también se recuerdan 
más fácilmente en la forma V A (V/) = 0, V(V A V) = 0, pues formalmente son 
propiedades válidas para vectores y escalares cualesquiera. 




U). 




V(/fl) 

v(/v) 

V A (fV) 
V(7A W) 



.9(V/) + f(Vg) 
(V/)V + /(W) 
(V/ A V) + /(V A V) 
W(V A V) - V(V A W) 



(10.8) 
(10.9) 
(10.10) 
(10.11) 
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Coordenadas curvilíneas ortogonales Sea X : U — > S una aplicación de 
clase C 1 entre dos abiertos de IR 3 . Podemos considerar a S como una variedad 
diferenciable y a X como una carta de S. Entonces X^ 1 es un sistema de 
coordenadas que a cada punto p = (xi, x 2 , x 3 ) € S le asigna unas coordenadas 
u = (ui,u 2 ,u 3 ). Supondremos que X es ortogonal, en el sentido de que los 
coeficientes g^ del tensor métrico son nulos cuando i ^ j. Recordemos que 
9ij( u ) = DiX(u)DjX(u). Abreviaremos /i¿(w) — W gu(u) — \\DiX(u)\\. 

La ortogonalidad de X equivale a que los vectores DiX(u) forman en cada 
punto p = X{u) una base ortogonal de T p (S). Por consiguiente los vectores 
Vi(u) = h~ 1 (u)DiX(u) forman una base ortonormal, a la que nos referiremos 
simplemente como la base asociada al sistema de coordenadas dado. 

Si llamamos u = X~ x , su matriz jacobiana es Ju(p) = JX^ 1 {u{p)). Puesto 
que (gij) = (JX)(JXY es una matriz diagonal, lo mismo le sucede a su inversa, 
luego (Ju)(JuY es diagonal en cada punto. Más concretamente: 



0 si i ^ j 

De aquí podemos obtener las coordenadas de los gradientes Vtt¿ en la base 
(vi,v 2 ,v 3 ). En efecto, si 

Vuí = anvi + a i2 v 2 + a i3 v 3 = — D X X + — D 2 X + — D 3 X, 

hi h 2 h 3 



aplicando la base dual duj resulta que 

= d Uj (p)(Vu,(p)) = Vujip^Uiip), 



hj(p) 



con lo que 



Vuí=^- Ví . (10.12) 

Consideremos ahora una función / : S — > R de clase C 1 . Llamaremos 
también / a su composición con X. Mediante la regla de la cadena se comprueba 
fácilmente que 

V/ = ¿^V», = £l^„„ (1*13) 

1=1 1=1 

que es la expresión del gradiente en en sistema de coordenadas considerado. 
Consideremos ahora un campo vectorial en coordenadas curvilíneas 

A = ai(ui,u 2 ,u 3 )vi + a 2 (ui,u 2 ,u 3 )v 2 + a 3 (ui,u 2 ,u 3 )v 3 . 

Vamos a calcular su divergencia. Supondremos que las coordenadas están 
ordenadas de modo que la base («1,^2,^3) es positiva. Entonces v\ = v 2 A v 3 , 
v 2 = v 3 A vi y v 3 = vi A v 2 . Teniendo en cuenta (10.12) podemos escribir 



A = aih 2 h 3 (Vu 2 A Vu 3 ) + a 2 hih 3 (Vu 3 A Vui) + a 3 hih 2 (X7ui A Vu 2 ). (10.14) 
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Calculamos divA aplicando (10.9), (10.11) y el hecho de que el rotacional 
de un gradiente es nulo. El resultado es 

V(ai/i 2 /i 3 )(Vu2 A Vu 3 ) + V(a 2 h 1 h 3 )(Vu 3 A Vtii) + V(a 3 /ii/i 2 )(Vui A Vu 2 ). 

Ahora aplicamos (10.13) teniendo en cuenta que un producto mixto con dos 
vectores iguales es nulo. Obtenemos 

(daxhih-i da 2 hih 3 da 3 hih 2 \ , ^ ^ , 

divA= — 1 1 (Vui, V« 2 , Vu 3 ). 

\ aui ou 2 ou 3 J 

Finalmente observamos que (vi,v 2 ,v 3 ) = 1, lo que juntamente con (10.12) 
nos da 

fc v A _ 1 í daih 2 h 3 da 2 hih 3 ^ da 3 hih 2 \ 
h\h 2 h 3 \ du\ du 2 du 3 ) ' 

Para calcular el rotacional de A partimos de (10.14) y aplicamos (10.10) 
junto con el hecho de que el rotacional de un gradiente es nulo. Así pues, 

rot A = V(aifti) A Vtii + V(a 2 h 2 ) A Vu 2 + V(a 3 h 3 ) A Vu 3 . 

Aplicamos (10.13) junto con el hecho de que el rotacional de un gradiente es 
nulo. 



rot A 



da x hi da x hi 

— \7u 2 A Vui H ?¡ Vu 3 A Viti 

ou 2 ou 3 



da 2 h 2 
da 3 h 3 



Vui A V«2 



da 2 h 2 
du 3 



Vu 3 A V« 2 



Vui A Vk 3 + d° 3 ^ 3 Vu 2 A Vu 3 . 
ou\ au 2 

Por último aplicamos (10.12) y agrupamos los coeficientes de cada v¿. El 
resultado se recuerda mejor mediante la regla mnemotécnica 



rot A - 



hih 2 h 3 



h\Vi h 2 v 2 h 3 v 3 



a 



a 

t)u-2 



a 

du 3 



h\a\ h 2 a 2 h 3 a 3 

La relación A/ = div V/ nos da inmediatamente la expresión del laplaciano: 



A/: 



1 



d ( h 2 h 3 df 



h\h 2 h 3 \dui \ hi du\ 



d 

du 2 



hih 3 df 
h 2 du 2 



d 

du 3 



h\h 2 df 
h 3 du 3 



Notemos que las fórmulas anteriores se reducen a las usuales en el caso de 
las coordenadas cartesianas, para las cuales h\ = h 2 = h 3 — 1. Existen varios 
sistemas de coordenadas que ayudan con frecuencia en los cálculos con vectores. 
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Citaremos por ejemplo el caso de las coordenadas 
esféricas, definidas sobre el abierto 

S={(x,y,z)eR 3 \x 2 + y 2 ¿0}. 

En un entorno de cada punto vienen dadas por 

X(r,0,(f)) = (r sen 6 eos (f>, r señasen (f>, reos 9). 



z 










y 







Es fácil ver que constituyen un sistema de coordenadas 
ortogonales positivamente orientado con h r = 1, he = r y h$ = rsenO. 

Otro caso es el de las coordenadas cilindricas, definidas en el mismo abierto 
y dadas por 

X(r,9,z) = (rcos9,rsen0,z). 
Claramente h r = 1, h$ = r, h z = 1. 



Capítulo XI 

Cohomología de De Rham 



La regla de Barrow reduce el problema de calcular la integral de una función 
continua cualquiera al cálculo de una primitiva. En la práctica existen funciones 
para las cuales la determinación de una primitiva puede ser muy complicado, e 
incluso puede ocurrir que dicha primitiva no admita una expresión en términos 
de funciones "conocidas", como senos, exponenciales, etc. y que por consiguiente 
la citada regla, aunque pueda ser de utilidad, no resuelve completamente el 
problema. No obstante, contamos con el hecho de que toda función continua en 
un intervalo tiene primitiva o, lo que es lo mismo, que toda 1-forma continua 
/ dx en un intervalo puede expresarse como dg, para una cierta 0-forma g. 

La situación es distinta en el caso general: no es cierto que toda fc-forma u 
sea la diferencial de una k — 1-forma, ni siquiera en el caso de 1-formas sobre 
1-variedades distintas de los intervalos. El teorema de Stokes hace que sea 
interesante determinar bajo qué condiciones una forma es la diferencial de otra. 
Además, bajo este planteamiento caben problemas muy variados. Por ejemplo, 
un campo F en M™ es conservativo si y sólo si es el gradiente de una función, lo 
cual equivale a que la 1-forma F dr sea la diferencial de una 0-forma. 

Definición 11.1 Diremos que una k- forma u> es exacta si w = duj' , para una 
cierta k — 1-forma w'. Diremos que u> es cerrada si dúo = 0. 

Es obvio que una condición necesaria para que una forma sea exacta es que 
sea cerrada, pues si w = dJ entonces duj = d(doj')) = 0. Sucede que en muchos 
casos esta simple condición es también suficiente. En este capítulo veremos 
lo más básico de una importante teoría que nos permite determinar bajo qué 
condiciones esto es así. 

11.1 Grupos de cohomología 

Nota En las secciones siguientes, cuando hablemos de variedades diferencia- 
bles entenderemos que tienen cartas de clase C°° y cuando digamos que una 
función o una forma es diferenciable entenderemos que es de clase C°° . 
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Comenzamos con unas definiciones algebraicas que que se ajustan a la es- 
tructura de las álgebras de Grassmann: 

Definición 11.2 Un módulo graduado sobre un anillo A es una suma directa 
de A- módulos C = ® Cfc. 

feez 

Los elementos de cada submódulo Ck se llaman homogéneos de grado k. 

Un submódulo graduado de C es un módulo graduado D tal que Dk = C^flD. 

Un homomorfismo graduado f : C — > D (de grado d) entre módulos gra- 
duados es un homomorfismo de módulos tal que fk — f\ck '• — ► Df¿+d para 
todo entero fc. 

Un complejo es un par ordenado 6 = (C, d), donde C es un módulo graduado 
y d : C — > C es un homomorfismo de grado ±1 tal que d o d = 0. Si d tiene 
grado —1 el complejo se dice directo y si el grado es 1 se dice inverso. 

Un complejo directo puede verse también como una sucesión de módulos y 
homomorfismos : 

dk+2 „ <9fc + i d k „ dk-i 
■ ■ ■ > > <^k > <-^fe-l > ' ' ' 

de modo que d^+i o dk = 0 para todo fc. Un complejo inverso es igual pero 
cambiando el sentido de las flechas. 



Ejemplo Si S es una variedad diferenciable, el álgebra de Grassmann 

A(5) = 0A fc (S) 

fcez 

es un espacio vectorial graduado (tomando A k (S) = 0 para k < 0). Además la 
diferencial exterior d es un homomorfismo de grado 1 en AS que lo convierte en 
un complejo inverso. ■ 

Notemos que todo complejo directo puede verse como un complejo inverso sin 
más que cambiar los índices, por lo que todo lo que vale para complejos directos 
vale para complejos inversos. La diferencia la marca únicamente la práctica: 
del mismo modo que resultaría artificial tratar al álgebra de Grassmann como 
un complejo directo, hay otros complejos que resultaría artificial tratarlos como 
complejos inversos. 

Es costumbre usar términos distintos para referirse a los conceptos corres- 
pondientes a los complejos directos y a sus análogos en los complejos inversos. 
Para empezar, los módulos homogéneos de un complejo inverso se suelen repre- 
sentar con superíndices C k en lugar de con subíndices C\. 

Dado un complejo 6 = (C, d), el homomorfismo d recibe el nombre de ope- 
rador frontera en un complejo directo y operador cofrontera en un complejo 
inverso. 
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Los elementos de C k (en un complejo directo) se llaman cadenas de dimensión 
fc y los de C (en un complejo inverso) se llaman cocadenas de dimensión fc. 

Los elementos de Z k = N(dfc) (el núcleo de d k ) se llaman ciclos de di- 
mensión k. Respectivamente, los elementos de Z k — N(<9 fe ) se llaman cocidos 
de dimensión k. 

Los elementos de F k = Im(9 fe+1 ) (resp. F k = lm(d k ^ 1 )) se llaman fronteras 
(resp. cofronteras) de dimensión k. 

La condición d o d = 0 implica que F k C Z fe (resp. i^ fc C Z k ). El módulo 
cociente H k (Q) = Z k /F k (resp. H k (G) = Z k /F k ) recibe el nombre de grupo 
de homología (resp. grupo de cohomología) de dimensión k. Dos (co)ciclos son 
(co)homólogos si pertenecen al la misma clase de (co)homología. 

Una vez entendida la cuestión de notación, en lo que sigue desarrollaremos 
la teoría en términos de cohomología, pues las álgebras de Grassmann son com- 
plejos inversos. Si 6 es un complejo, definimos 

ir(e) = 0ír*(e), 

fcez 

que es obviamente un módulo graduado. 

Definición 11.3 Sea S una variedad diferenciable. El grupo de cohomología 
de dimensión k del álgebra de Grassmann A(S) recibe el nombre de grupo de 
cohomología de De Rham de dimensión k de la variedad S y se representa por 
H k (S). Llamaremos 

H(S) = ($H k (S). 

fcez 

Notemos que las cocadenas de dimensión k son las fc-formas, los cocidos son 
las fc-formas cerradas y las cofronteras son las fc-formas exactas. Los grupos de 
cohomología son en este caso espacios vectoriales sobre R. 

Si S es una variedad de dimensión n es evidente que H k (S) = 0 para k < 0 
y k > n. Los 0-cociclos son las funciones en S cuya diferencial es nula. Si S 
es conexa son exactamente las funciones constantes y como F° — 0, concluimos 
que H°(S) = R. Más en general, es fácil ver que si S tiene p componentes 
conexas entonces H°(S) ^ W. 

El objetivo de la teoría que estamos desarrollando es calcular los grupos de 
cohomología H k (S) para 1 < k < n, pues si probamos que H k (S) = 0 entonces 
sabemos que las fc-formas exactas coinciden con las cerradas y tenemos así una 
caracterización sencilla de las primeras. 

Definición 11.4 Un homomorfismo de complejos <f) ■ C — > C es un homomor- 
fismo de grado 0 tal que cpod' = docfi, o equivalentemente, tal que los diagramas 
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siguientes conmutan: 



C k-1 C k Qk + 1 



Lk-1 



> (J'k-l 9 "° * Qlk d ' k j (Jlk+1 > 

Es claro que un homomorfismo 4> envía ciclos a ciclos y fronteras a fronte- 
ras, luego induce homomorfismos <¡> k : H k (C) — > H k (G') o, equivalentemente, 
induce un homomorfismo de grado 0 

<¡>:H(e) — >H(&). 

Es inmediato que la composición de homomorfismos de complejos es un ho- 
momorfismo de complejos así como que <fi o ip = <j> o tp. Si 0 es un isomorfismo 
entonces <f> también lo es y (</>) _1 = <¡>~ x - Si / : S — > T es una aplicación dife- 
renciable entre variedades, la retracción /" : A(T) — > A(<S) es un homomorfismo 
de complejos, que a su vez induce un homomorfismo fí : H(T) — > H{S). Por 
simplificar la notación escribiremos / en lugar de /". 

Ejercicio: Sea S = (J Si una unión disjunta de variedades (entendiendo que cada 

iei 

una de ellas es abierta y cerrada en S). Probar que H(S) = Yl H(Si). 

iei 

Los difeomorfismos entre variedades inducen isomorfismos entre los grupos 
de cohomología de De Rham. Esto era de esperar. Sin embargo, vamos a probar 
que hay aplicaciones mucho más generales que los difeomorfismos y que también 
inducen isomorfismos entre los grupos de cohomología, lo que nos permitirá 
reducir el cálculo de unas variedades a otras más simples. Dedicamos a ello la 
sección siguiente. 



Afe+l 



11.2 Homotopías 

Recordemos que tenemos definido el producto de una variedad sin frontera 
por una variedad con o sin frontera. Claramente, el producto de una recta y 
una circunferencia nos da una superficie cilindrica, mientras que el producto de 
una recta y un círculo nos da un cilindro sólido (con o sin frontera, según si 
el círculo es cerrado o abierto). En general, dada una variedad S, llamaremos 
cilindro de S a la variedad producto Rx5. Conviene pensar en IR x S como 
en infinitas copias de S "apiladas" una encima de otra, cada una a una altura 
t. Concretamente, la copia de altura t G R es S t = {t} x S. Es claro que S t es 
una variedad difeomorfa a S. 

Cuando trabajemos con un cilindro Rx5 consideraremos únicamente cartas 
de la forma X = I x X , donde / es la identidad en R y X es una carta en S. 
De este modo, X(t,u) = (t,X(u)). En particular vemos que el primer vector 
de la base canónica está en todos los espacios tangentes: 



d =D 1 X(t,u) 6T (tiP) (RxS). 
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Definición 11.5 Dos aplicaciones /, g : Si — ► S% diferenciables entre dos 
variedades son homotópícas si existe H : K x Si — ► 52 diferenciable de modo 
que para todo p £ Si se cumpla 



H(Q,p) = f(p), H(l,p)=g(p). 
Se dice que la aplicación H es una homotopía entre / y g. 



Es decir, dos aplicaciones son homotópicas si una se puede transformar en 
la otra mediante una gradación diferenciable. 



Ejemplo Sea S\ la bola abierta de centro 0 y radio 2 en W 1 menos su centro 0. 
Se trata de un abierto en IR™ y por lo tanto es una variedad. Sea / : Si — ► S\ 
la aplicación identidad y sea g : Si — > S± la aplicación dada por g(x) — x/||x||. 
Ambas son homotópicas. Basta considerar la homotopía 



H(t,x) 



tx 



+ (l-t)x. 




Si fijamos x y hacemos variar t en- 
tre 0 y 1 vemos que H(t, x) recorre el 
segmento radial que va desde x hasta 
la circunferencia unidad. Así, H trans- 
forma 5*o en todo So ( es I a identidad), 
al llegar al/2 cada punto ha recorrido 
la mitad de su camino hasta la circun- 
ferencia, por lo que la imagen de S1/2 
es la corona sombreada en la figura, y finalmente la imagen de Si es la circun- 
ferencia. La homotopía H aproxima paulatinamente la imagen de cada punto 
por la aplicación / hasta su imagen por la aplicación g. m 

El objetivo de esta sección es probar que dos aplicaciones homotópicas en- 
tre variedades inducen la misma aplicación entre los grupos de cohomología. 
La prueba es una generalización de un teorema de Poincaré y necesita varios 
conceptos previos. 



La evaluación Sea S C K m una variedad y V un campo de vectores tangentes 
en S, es decir, V : S — ► M. m es una función diferenciable y para cada p £ S 
se cumple V(p) £ T p (S). Entonces V induce una aplicación lineal de grado — 1 
i(V) : A(S) — ► A(S) que a cada fc-forma lo le asigna la k — 1-forma dada por 

i{V){uj)(p)(vi,. . . , v k -i) = uj{p)(V(p),v ll . . . , v k -i). 

Convenimos que í(V)(f) — 0 para toda / G A°(S). 

Es claro que i(V)(uj)(p) £ A fc_1 (T p (S)), pero falta ver que i{V)(u) es di- 
ferenciable. En principio i(V) es una aplicación lineal de A(S) en el álgebra 
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de todas las formas en S, no necesariamente diferenciables. Una comprobación 
rutinaria nos da que si u>\ € A k (S), üj 2 € A(S'), entonces 1 

i(V)(ui A lü 2 ) = i(V)(w!) Alu 2 + (-l) fe ^i A í{V)(üj 2 ). 

Las aplicaciones lineales que cumplen esta relación se llaman antiderivacio- 
nes. Otro ejemplo de antiderivación es la diferencial exterior. 

Para probar que i(V)(u>) es diferenciable en un punto p tomamos una carta 
X alrededor de p. Si W es el rango de X, notamos que ¿(V|w)(a>|w r ) coincide con 
i(V)(u>)\w, luego basta probar que la primera es diferenciable. Ahora bien, una 
forma en W se expresa en función del producto exterior a partir de 0-formas y 
las diferenciales de las coordenadas dxi y al ser una antiderivación í(V|w)(w|vk) 
quedará en función de las imágenes por ¿(V|w) de estas formas en particular, 
luego basta ver que i(V\w)(dXi) es diferenciable (para las 0-formas es obvio, 
porque la imagen es nula). Ahora bien, 

i(V\ w )(dxi)(p) = dxi(p)(V(p)) = Vi(p), 

n 

donde V(X(x)) = ^2 V¿(X(x)) DiX(x). El teorema de la función implícita 

¿=i 

justifica que las funciones X o V¿ son diferenciables (luego las V¿ también). 
La antiderivación ¿(V) se llama evaluación en V. 

En particular, en un cilindro R x S podemos considerar el campo constante 
igual a e\. Si S se puede cubrir con una sola carta X y llamamos (i, x\, . . . , x n ) 
a las coordenadas del cilindro, tenemos que i(e\)(dt) = 1, ¿(ei)(dx¿) = 0. Estas 
relaciones determinan a i(e\). Concretamente: 

i(ei)(f dt A dx il A • • • A dx ik ) = f dx^ A • • • A dx ik , 

i(ei)(f dx h A • • • A dx lk ) = 0. 

Las inclusiones Consideremos ahora las inclusiones jt ■ S — > M. x S dadas 
por j t (p) = (t,p). Obviamente son diferenciables, por lo que tienen asociadas 
las retracciones jf : A(M x S) — > A(S*), que son homomorfismos de grado 0. Si 
S se puede cubrir por una sola carta tenemos 

A (/) = 3t o f, 3¡ ( dt ) = 0> 3t ( dx i) = dx * . 
con lo que quedan completamente determinadas. 

^^En la definición de í^i /\u>2 separamos los sumandos correspondientes a las permutaciones 
que dejan a V(p) entre las k primeras componentes y las que lo dejan entre las siguientes. En 
el primer sumando sustituimos cada permutación a por permutación a que resulta de llevar 
V(p) a la primera posición. El cambio de signo que sufre ui se compensa con el cambio de 
signatura de a a á. Así tenemos una suma sobre las permutaciones cr tales que ít(1) = 1. 
Identificándolas con las permutaciones de k + k' — 1 elementos obtenemos i(y)(wi)(p) Au>2(p). 
Con el segundo sumando razonamos igual, salvo que llevamos V(p) a la posición k + 1. Ahora, 
al pasar de las permutaciones que cumplen tr(l) = k + 1 a la permutación correspondiente de 
k + fe' — 1 elementos la signatura varía en (— l) k . 
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El operador integral Finalmente, dados dos números reales a < b, definimos 
una aplicación lineal l h a : A(Rx S) — > A(S) de grado 0 que a cada lu e A k (RxS) 
le asigna 

ll(u)(p)(vi,---,v k )= / j¡(w)(p)(v 1 ,...,v k )dt. 

J a 

Fijado un punto p E S y una carta X a su alrededor, la restricción de w al 
rango de J x 1 se expresa como suma de fc-formas de tipo 

r¡ = f dx h A • • • A dx ik , 

donde admitimos la posibilidad de que i\ — 0 con el convenio de que xq = t. 
Si aparece dt, entonces j|(í?) = 0 y el término no contribuye en nada. En caso 
contrario 

3t(v)(p)(vi, ...,v k ) = f(t,p)(dx il A • • • A dx ik )(vi, . . .,v k ), 

luego 

fb 

Tbl 



Ia(v)(p)(vi,---,v k ) = ( / f(t.p)dt ) ((/.r;, A • • \(/.r, l(rj r,, ). 

y en definitiva 



(í 



í(l)= I / /di N^A^Ad^. 



El teorema 7.23 implica que I^iji) es una forma diferenciable. En general 
J^(w) (restringida al rango de I x X) es una suma de formas de este tipo, luego 
efectivamente I^(oj) G A(S). Evidentemente l h a es lineal. Veamos que conmuta 
con la diferencial exterior, es decir: d o 1° = l h a o d. 

Sea p £ S y X una carta alrededor de p. Es claro que el valor que toma 
en p la imagen de una forma por cualquiera de los dos miembros será la misma 
que la imagen de la restricción de dicha forma al rango de la carta I x X por el 
operador integral en dicho abierto. Así pues, podemos trabajar con una forma 
definida en el rango de I x X. Como ambos miembros son lineales podemos 
tomarla de tipo 

uj = f dxi x A • • • A dxi k . 

Si i\ — 0, es decir, si w contiene a dt, entonces du se expresará como suma de 
formas, todas ellas con dt, luego tanto si hacemos actuar primero la diferencial 
como el operador integral obtenemos la forma nula. Supongamos, pues, que uo 
no contiene a dt. Entonces, tanto en un orden como en otro, llegamos a 



dxi A dx i% A • • • A dx ik . 
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Ahora probamos una igualdad que relaciona todas las funciones que acaba- 
mos de introducir y a partir de la cual se deducirá fácilmente el resultado que 
queremos probar sobre homotopías. Veamos que 

Ó\ - A = do »( ei ) o II + i( ei ) ollod. (11.1) 

Puesto que el operador integral conmuta con la diferencial, podemos escribir 
el segundo miembro como (do i(e\) + i(e\) o d) o l h a . Por el argumento habitual 
podemos restringirnos al rango de una carta y trabajar con una forma 

lo = f dx il A • • • A dxi k . 

A su vez hemos de distinguir si aparece dt o no. Si no aparece tenemos que 
d(*(ei)(w)) = 0 y 

df 

i(ei)(dív) = — dx i± A • • • A dx ik . 
Al aplicar I h a obtenemos 



i Í a 



b df \ 

— dt J dx h A • • • A dx ik = (j b o/- /„ o f)dx h A • • • A dx ik = jl(u) 



Supongamos ahora que u = f dt A dx Í2 A • • • A dx ik . Entonces 

dt A d 

dx. 



duj = — — — dt A dxi A dx Í2 A • • • A dx ik , 



luego 



i(ei)(duj) = — — — dxi A dx Í2 A • • • A dxi 

. OXi 



d(i(ei)(w)) = — — dxi A dx Í2 A • • • A dx ik + — dt A da; ¿2 A • • • A dx ik . 

Al sumar estos dos términos nos queda sólo el último sumando de la última 
igualdad y, como tiene dt, al aplicar I h a queda la forma nula. Así mismo es claro 
quejj¡(w) - j{{u)) = 0. ■ 

Ahora conviene introducir el concepto siguiente: 

Definición 11.6 Sean </>, ip : G — > & homomorfismos de complejos inversos. 
Diremos que son homotópicos si existe un homomorfismo h : G — > G' de grado 
— 1 tal que (j) — ip — h& + dh. Equivalentemente, tal que 

4> k - ip k = d k h k+1 + h k d k -\ 

En tal caso diremos que h es una homotopía 2 entre 0 y ip. 



-Las homotopías entre homomorfismos de complejos directos tienen grado 1 
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Es evidente que si <j> y ip son homotópicos entonces ip — <fi transforma cocidos 
es cofronteras, por lo que <j> = ip. 

Casi tenemos probado el teorema siguiente: 

Teorema 11.7 Si f,g : Si — > S2 son aplicaciones homotópicas entre varieda- 
des, entonces f*,g* ■ A(S I 2) — > A(Si) son homomorfismos homotópicos. 

Demostración: Sea H : R x Si — > S 2 una homotopía entre / y g. Defini- 
mos h = o i(ei) o /q. Claramente /i : A(S2) — > A(Si) es un homomorfismo 
de grado —1. Componiendo con íf" en ambos miembros de (11.1) obtenemos 

0 (i? - Jo) = H i odo i(ei) o J¿ + H* o i(ei) o J¿ o d. 

El primer miembro es (ji o ií)" — (j 0 o = — Teniendo en cuenta 
que H$ conmuta con la diferencial, el segundo miembro es d o h + h o d, luego h 
es una homotopía. ■ 



Definición 11.8 Sean Si C £2 variedades diferenciables. Una retracción de £2 
en Si es una aplicación r : S2 — > £1 diferenciable tal que sea la identidad. 
En tal caso se dice que Si es un retracto de S 2 - Si la retracción es homotópica 
a la identidad en S 2 entonces se dice que la variedad Si es un retracto por 
deformación 3 de S2. 

Informalmente, Si es un retracto por deformación de S2 si S2 puede defor- 
marse gradualmente hasta quedar aplastado sobre Si y ello sin mover ninguno 
de los puntos de Si. 

Por ejemplo, la esfera unitaria de dimensión n es un retracto de la bola 
(abierta o cerrada) de dimensión n+ 1 de centro 0 y radio 2 menos el origen, tal 
y como muestra el ejemplo que hemos visto de homotopía. En realidad es claro 
que los centros y los radios son irrelevantes: cualquier bola menos su centro se 
puede retraer homotópicamcntc hasta cualquier esfera concéntrica contenida en 
ella. La deformación consiste en agrandar paulatinamente el agujero que deja 
el centro y contraer los puntos exteriores a la esfera. 

Una superficie cilindrica puede retraerse hasta una circunferencia (sin más 
que aplastar verticalmente sus paredes). Un toro sólido puede "estrangularse" 
hasta una circunferencia. 

Las variedades que pueden retraerse a un punto se llaman contractibles. 
Entre ellas se encuentran R™, las bolas abiertas y cerradas y, más en general, 
todas las variedades cubribles por una sola carta con dominio contractible. En 
cambio, una esfera no es contractible (como veremos enseguida). 

El interés de todo esto radica en que los retractos por deformación tienen la 
misma cohomología: 



3 Estos conceptos tienen interés para espacios vectoriales arbitrarios, considerando entonces 
retracciones y homotopías continuas, ya no diferenciables. 
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Teorema 11.9 Sea Si un retracto por deformación de una variedad S* 2 . En- 
tonces la inclusión i : Si — > S2 induce un isomorfismo i : H{S2) — > H(S\). 

Demostración: Sear : S2 — > Si una retracción homotópica a la identidad 
en S , 2 . Entonces i o r = 7|s i; luego r o i = I\h(s 1 )- P° r °tra parte, roí, es 
decir, r vista como aplicación de £2 en S2, es homotópica a la identidad, luego 
el teorema anterior nos da que r o i = I\h(s 2 )i luego i o f = I\h(s 2 )- 

Estas relaciones prueban que i y f son biyectivas y mutuamente inversas. 

■ 

Así pues, si queremos conocer la cohomología de todas las variedades con- 
tractibles no tenemos más que estudiar la más simple de todas: el punto. 

Teorema 11.10 Sea S una variedad contractible. Entonces 

H°(S)^R, H k (S) = 0 parak^O. 

Demostración: Según lo dicho basta estudiar la cohomología de De Rham 
de la 0- variedad S formada por un punto. La variedad tangente es trivial, luego 
A k (S) = 0 para k > 0 y consecuentemente todos los grupos de cohomología 
(salvo el primero) son triviales. 4 ■ 

Para terminar la sección observamos que, tal y como habíamos afirmado, 
las esferas no son contractibles. Más en general, ninguna variedad compacta 
orientable S sin frontera es contractible. En efecto, si S tiene dimensión n, 
el teorema de Stokes implica que la diferencial de una n — 1-forma en S tiene 
integral nula, pero el elemento de medida de S es una n-forma cuya integral 
no es nula, luego no es la diferencial de ninguna n — 1-forma, y obviamente es 
cerrada, luego H n (S) ^ 0. 



11.3 Sucesiones exactas 

Ya hemos visto cómo las homotopías nos permiten relacionar los grupos de 
cohomología de variedades distintas. Otra potente herramienta para relacionar 
grupos de cohomología son las sucesiones exactas: 

Definición 11.11 Diremos que una sucesión de homomorfismos de módulos 

• • • ^ M k _i M k ^ Mk+ i *i±í ■ • ■ 

es exacta en M k si Im = N(4>k)- Diremos que es exacta si lo es en todos 
los módulos. 

4 Quizá el lector ponga en duda que los teoremas que hemos probado pensando en variedades 
arbitrarias sean aplicables a un punto. Lo cierto es que así es, pero, de todos modos, si S es 
un espacio contractible entonces la identidad es homotópica a una función constante c, pero 
I = I\h(S) y c fc = 0 para k > 0, todo ello sin hacer referencia a 0- variedades. 
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Notemos que la exactitud en M de una sucesión de la forma 

N -?->• M — > 0 

equivale a que a sea suprayectiva (en situaciones como ésta se entiende que la 
flecha sin nombre representa al homomorfismo nulo, pues no hay otra posibili- 
dad). Igualmente, la exactitud en M de una sucesión 

0 — > M N 

equivale a que a sea inyectiva. Por consiguiente, una sucesión exacta de la forma 

0 — ► M — > N — > 0 

nos da que M y N son isomorfos. Las situaciones de este tipo son las que hacen 
útiles a las sucesiones exactas. El resultado principal de esta sección es un teo- 
rema que a partir de una sucesión exacta entre complejos nos permite construir 
una sucesión exacta entre sus grupos de cohomología. Como aplicación obten- 
dremos la cohomología de las esferas. Veamos primero un resultado auxiliar. 

Teorema 11.12 Consideremos el siguiente diagrama conmutativo de módulos 
y supongamos que sus filas son exactas. 

Z' 1 Z' 2 Z ri — » 0 



d 



d 



.2 



d 3 



0 — > Z 1 — > Z 2 — > z 3 

4> V> 

Entonces existe un homomorfismo de módulos d* : N(<9 3 ) — > Z /Imd tal que 
la sucesión 

Nid 1 ) -C N(9 2 ) ^ N(¿> 3 ) Z^lmd 1 Z 2 /lmd 2 Z 3 /Imd 3 

es exacta, donde cp" y ip" son las restricciones de <¡>' y ip' a N^ 1 ) y N(<9 2 ) y <j>, 
■tp son los homomorfismos inducidos de forma natural. 

DEMOSTRACIÓN: Es fácil comprobar que las aplicaciones <p" , tp", <j> y tp 
están bien definidas, así como la exactitud de la sucesión en N(<9 2 ) y Z 2 /lmd 2 . 

Para definir 5* tomamos c 3 € N(<9 3 ). Entonces existe c' 2 € Z' 2 tal que 
c's = V(C 2 ). Como ip{d 2 {c' 2 )) = d 3 ^'^)) = d 3 (c 3 ) = 0, existe un d € Z 1 tal 
que 0( Cl ) = 9 2 (4). 

Es claro que es único módulo N(V , 0 = I m 0'; luego d 2 (c' 2 ) es único módulo 
^[Imc? 1 ], luego ci es único módulo Im/) 1 . 

Por lo tanto podemos definir 5*(c' 3 ) = c\ + Im<9 1 . Es claro que, así definido, 
es un homomorfismo de módulos. (Observar que en definitiva S* se calcula 
eligiendo una antiimagen por tp' , su imagen por d 2 y una antiimagen por ip.) 

Es claro que Imtp" C N(<5*). Si c' 3 € N(5*) entonces c\ = 9 1 (c' 1 ), para 
un cierto c[ G Z(, luego d 2 {c' 2 ) = <¿>(ci) = «K^Vi)) = <9 2 (<//(ci)), con lo 
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que 4 - ¿>'(c'i) e N(9 2 ) y así c£ = VV 2 ) = - + W(c'i)) = 

También es claro que ImS* C N(0). Si Ci + Imd 1 € N(0) entonces tenemos 
que 4>(ci) e Imd 2 , digamos <j>{c\) = <9 2 (c' 2 ), con c' 2 € Z' 2 . Sea C3 = ip'(d 2 )- Es 
claro que c' 3 € N(<9 3 ) y por construcción <5*(c^) = ci + Imc* 1 , luego concluimos 
que ci + Im di € Im S* . m 

He aquí el resultado que queríamos probar: 

Teorema 11.13 Si 0 — > .A — > 25 — > C — > 0 es una sucesión exacta de 
homomorfismos de complejos de grado 0 entonces existe un homomorfismo de 
módulos S* : H(G) — > H{A) de grado 1 tal que la sucesión siguiente es exacta: 

► H k (A) ^ H k CB) ^ H k (G) (S X H k+1 (A) ^ H k+1 {H) — • • • 

Equivalentemente, tenemos el triángulo exacto 

H(G) H(A) 

H(V) 

Demostración: Tenemos las sucesiones exactas 

o — » c k (A) c íi cb) c fe (e) — » o, 

para todo k £ Z. 

Basta comprobar que el diagrama siguiente se encuentra en las hipótesis del 
teorema anterior. 

C k {A)/F k {A) C k { r B)/F k {%) C k (G)/F k (e)^0 



gk 



d 



& 



1 



0^ z k+1 {A) ^ z fc+1 (i5) z fe+1 (e) 

(donde Z y F representan los grupos de cocidos y cofronteras de los complejos.) 

Ciertamente la fila superior está bien definida, ip k es suprayectiva y se cumple 
hn<j> k C NO fe ). 

Si i/> fe (u + F fc ('B)) = 0 entonces i/> fe (u) € F k (G), luego ^ k (u) = d**' 1 ^), 
para un cierto v € C* _1 (C), que a su vez es de la forma v = ip k ~ 1 (w) con 
w e C^CB). Así pues, %l> k (u) = d k - 1 (tp k - 1 (w)) = ip k (d^ 1 (w)) , con lo 
que u — d k ~ 1 (w) € N(ip k )- Por consiguiente existe un x G C fc (.A) tal que 
u-d k - l {w) = 4> k (x), luego u + F k CB) = 4> k (x + F k {A)). 

Esto prueba la exactitud de la fila superior. Es obvio que el diagrama con- 
muta, que (¡> k+1 es inyectiva y que Im<f) k+1 C ~N(ip k+1 ). 
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Supongamos por último que x £ N(ip k+1 )- Entonces x = 4> k+1 (y) para un 
y £ C k+1 (A) y hay que probar que y £ Z k+1 (A). Ahora bien, <p k+2 (d k+1 (y)) = 
d k+1 (<j) k+1 (y)) = d k+1 {x) = 0 (pues x es un ciclo). Como (¡) k+2 es inyectiva 
resulta que d k+1 {y) = 0, luego y es un ciclo. ■ 

El homomorfismo S* recibe el nombre de homomorfismo de conexión de la 
sucesión exacta dada. Conviene recordar cómo actúa: dado un cocido de 6, 
tomamos cualquier antiimagen por ip, calculamos la cofrontera de ésta, calcula- 
mos su antiimagen por 0 y la clase del cocido resultante es la imagen por 5* de 
la clase del cocido de partida. 

Veamos un ejemplo importante de aplicación de este teorema: 

Sea S una variedad diferenciable y U\, U 2 dos abiertos en S de modo que 
S = U\ U U 2 , U\ n U 2 7^ 0. Claramente, U\, U 2 , U\ H U 2 son variedades 
diferenciables. Consideramos las inclusiones 

j 1 :U 1 DU 2 — >U U j 2 -U 1 nU 2 — > U 2 , ñ : C/j — >M, i 2 :U 2 — > Ai. 

A partir de ellas construimos una sucesión de aplicaciones lineales 

0 — » A{S) A(I7i) © A(í/ 2 ) A(I7i n t/ 2 ) — ► 0. (11.2) 

Definimos a(w) = y /3(wi,w 2 ) =Íi(^i) ~ Ái^)- 

Representaremos las diferenciales de A(S), A(Ui), A(U 2 ) y A{U\ H U 2 ) me- 
diante (i, di, d 2 y di2 respectivamente. Es claro que A(C/i) © A(Í7 2 ) es un 
complejo con el operador cofrontera dado por (di © d 2 )(wi,w 2 ) = (diWi, d 2 uo 2 ). 
Las aplicaciones es. y ¡3 son homomorfismos de complejos (es decir, conmutan 
con las diferenciales), luego inducen aplicaciones lineales 

5 : ff (5) — ► ÍT(^i) © íf(í/ 2 ), 0 : © ií(C/ 2 ) — ► n C/ 2 ). 

Veamos que la sucesión (11.2) es exacta, con lo que podremos aplicarle el 
teorema 11.13. En primer lugar probamos que (3 es suprayectiva. Fijemos una 
partición de la unidad p\, p 2 en S subordinada al cubrimiento U\, U 2 , es decir, 
Pi +P2 = 1, Pl<U\,P2< U 2 . 

Tomemos w £ A(Ui fl U 2 ). La función ¿i(p 2 ) está definida en U\ y se anula 
en un entorno de cada punto de U\ \ U 2 , luego la forma u¡i — (i\{p 2 ))uj se 
puede extender a U\ haciéndola nula en U\\U 2 . Similarmente tenemos uj 2 = 
(4(P2))w £ A(U 2 ). Es inmediato comprobar que ui = ¡3(uj\, —uj 2 )- 

La inyectividad de a es obvia: si a(cj) = 0 entonces u> se anula en U\ y en 
Í7 2 , luego se anula en S. 

Es claro que a o [3 = 0, luego Ima C N/3- Tomemos ahora (wi,o; 2 ) £ N/3- 
Entonces Wi(p) = w 2 (p) para todo p € U\ n C/ 2 y consecuentemente podemos 
definir uj £ A(S) que extienda simultáneamente awi y a u> 2 , pero esto equivale 
a decir que a(w) = (oji,üj 2 ). 
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Así pues, el teorema 11.13 nos da la existencia de un homomorfismo 5* de 
grado 1 que hace conmutativo el triángulo 

ff(C7inC72) H(S) 

H(Ui) ffi H(U 2 ) 
En otras palabras, tenemos una sucesión exacta 

► H k (S) ií fe (C/i) ffi # fc (t/ 2 ) # fe (£/i n c/ 2 ) ff fe+1 (S) — » • • • 

Esta sucesión se conoce como la sucesión de Mayer- Vietoris de S respecto 
al cubrimiento (U\, l^)- 



Ejemplo Para n > 1, sea S 1 ™ = {x € | ||x|| = 1}, es decir, la esfera de 

dimensión n. Vamos a calcular su cohomología. 
Fijemos 0 < e < 1 y consideremos los abiertos 

U = {x e S n | x n+1 > -e}, V = {x e S n | a: n+ i < e}. 

Los puntos de S 1 ™" 1 " 1 con a;„+i = 0 forman el ecuador de la esfera, el cual di- 
vide a la misma en dos hemisferios, correspondientes a x n+ \ < 0 y x n+1 > 0 res- 
pectivamente. Los abiertos U y V cubren cada uno un hemisferio extendiéndose 
un poco más allá del ecuador. Podemos formar la sucesión de Mayer- Vietoris 
de S n asociada al cubrimiento (U, V): 

► H k (S n ) — > H k (U) ffi H k (V) — > H k (U n V) — > H k+1 (S n ) — 

Es fácil ver que U y V son contractibles. Por ejemplo, para contraer U hasta 
el polo norte basta acercar paulatinamente a 1 la coordenada x n+ \ de cada 
punto. Por otro lado, U n V se puede contraer hasta el ecuador disminuyendo 
paulatinamente la coordenada x n+ i hasta hacerla nula. También es claro que 
el ecuador de S n es difeomorfo a S*™ -1 (entendiendo que S° está formada por 
dos puntos). Teniendo en cuenta estas consideraciones, la sucesión de Mayer- 
Vietoris se reduce a 

► H k {S n ) — » H k {p) 0 H k {p) — ► ií^S*™- 1 ) — ► H k+1 (S n ) —> ■ ■ ■ 

donde p representa a una variedad de dimensión 0 (un punto). El grupo H k (p) 
es distinto según si/c = 0osifc>0. Para k = 0 tenemos 

0 — ► M — > IR 2 — > ^(S"™" 1 ) — > ÍÍ^S") — > 0, 

y para /c > 0 tenemos 

0 — ► ^(S™- 1 ) — > H k+1 (S n ) — > 0. 



11.3. Sucesiones exactas 
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A partir de la primera sucesión, un simple cálculo de dimensiones nos da la 
relación dimií 1 (S'™) = dimH°(S n ^ 1 ) — 1, con lo que 

dimH 1 (S n ) = ¡l s ] n=í 

y ' 10 SI TI > 1 

La segunda sucesión nos da 

dimH k+1 (S n ) = dimH^S 11 - 1 ), para k > 1. 
A partir de aquí, una simple inducción prueba que 



dim H k (S n ) = 



1 sik = 0ok = n 
0 si 1 < k < n - 1 



Éste es el mejor resultado que podíamos obtener, teniendo en cuenta que ya 
sabíamos que H n {S n ) ¿ 0. ■ 



Ejercicio: Calcular la cohomología de un toro. 

Ejercicio: Calcular la cohomología de un círculo abierto con n agujeros. Probar que 
el grupo H 1 de K 2 con infinitos agujeros tiene dimensión infinita. 

Veamos un último ejemplo más sofisticado. Sea J : S — > S una involución 
en una variedad, es decir, un difeomorfismo tal que J o J sea la identidad. El 
caso típico es J : S n — > S n dado por J(p) = —p. 

Entonces J» : A(5) — > A(S) es un automorfismo con la misma propiedad: 
J ( o jl = I. Podemos descomponer A(S) = A+(5) ffi A_(S"), donde 

A + (S) = {w e A(S) | J*(u) = tu}, A_(S) = {uje A{S) \ J tt (w) = -w}. 

En efecto, basta tener en cuenta que 

U)+J*(lü) lu — J"(lu) 



Estos dos subespacios son estables para la diferencial, luego podemos verlos 
como complejos inversos, y es claro entonces que H(S) = H+(S) © H_(S), 
donde 

H+{S) = {a£ H(S) | J(a) = a}, H_(S) = {a € H(S) \ J(a) = -a}. 



Ejemplo Vamos a calcular H+(S n ) y H k (S n ). Obviamente son todos nulos 
excepto los correspondientes a k = 0, n. En cada caso, uno de los dos será nulo 
y el otro tendrá dimensión 1. Sólo hemos de decidir cuál es cuál. Para k = 0 
es obvio: la aplicación antípoda J deja invariantes a las funciones constantes, 
luego H%S n ) = R y H°_(S n ) = 0. 

Para k — n sabemos que el elemento de medida dm es un n-cociclo con 
integral no nula y por lo tanto no es una cofrontera. Por consiguiente la clase 



412 



Capítulo 11. Cohomología de De Rham 



de cohomología de dm es una base de H n (S n ). Hemos de ver si está en H™(S n ) 
o en H r _t(S n ). Dado p € S n y v u . . . , v n e T p (S n ), calculamos 

J i (dm)(p)(v l7 . . .,v n )= dm(j(p))(dj(p)(v 1 ), . . . , dj(p)(v n )) . 

Podemos considerar a J definida en todo La aplicación J en S es la 

restricción de ésta, luego dJ en S es la restricción de dJ en pero J es 

lineal, luego dJ{p) = J, para todo p € R n , luego en definitiva dJ(p)(v) = —v. 
Por consiguiente J^(dm)(p) = (— l)™dm(j(p)). 

Notar que la igualdad anterior tiene sentido porque S n tiene el mismo espacio 
tangente en dos puntos antípodas. Sin embargo, es fácil ver que la orientación 
de T p (S n ) es la opuesta de la de Tj^(S n ), por lo que dm(j(p)) = —dm(p). En 
resumen obtenemos que J^(dm) = (—l) n+1 dm, con lo que 

H (S n ) — / ^ si n es impar , „, _ ( 0 si n es impar 

+ [0 si n es par ~ | R si n es par 



El interés de estos grupos de cohomología se debe a lo siguiente: 

Teorema 11.14 Sea tt : S — > P un difeomorfismo local entre variedades, es 
decir, i: es diferenciable y suprayectiva y todo punto de S tiene un entorno 
abierto V tal que n[V] es abierto en P y la restricción de ir a V es un di- 
feomorfismo en su imagen. Sea J una involución en S y supongamos que 
para todo p € P se cumple 7r _1 (p) = {q, J(q)}, para cierto q € S. Entonces 
H k (P) = H^S). 

DEMOSTRACIÓN: Basta probar que 7r" : A(P) — > A + (5) es un isomorfismo. 
Puesto que J o ir = n, tenemos que 7r" o .P = 7r", luego la imagen de 7r" (que en 
principio estaría en A(S)) está en A + (S). 

Para probar que es inyectiva tomemos cu € A fe (P) no nula y veamos que su 
imagen es no nula. Tenemos que existe p € P y vi, . . . , Vk € T P {P) de modo 
que Lü(p)(vi, . . . ,v k ) ^ 0. Sea p = n(q), con q G S. El hecho de que ir sea 
un difeomorfismo local se traduce en que dn(q) es un isomorfismo, con lo que 
existen vectores w\, . . . , Wk tales que dn(q)(wi) — w¿. Es claro entonces que 

J(u)(q)( Wl , ...,w k ) = w(p)(ui, • ,V k ) + 0, 

luego it^{üo) ^ 0. 

Tomemos ahora u € A^S 1 ) y veamos que tiene una antiimagen. Fijemos un 
punto p € P. Sea g € S 1 tal que 7r(g) = p. Sea V a un entorno de q en el cual ir 
sea un difeomorfismo. Sea lo p = (^Iv^K^lnlv])^ Que es una fc-forma en ir[V]. 

Veamos que u) p no depende de ninguna de las elecciones que hemos hecho 
para construirla. Si p' es cualquier punto en n[V] y q' es su antiimagen en V, 
entonces 



lü p ( P ')(v u . ..,v k ) = ujiq'^diriq')- 1 ^), dir(q')-\vk)). (11.3) 
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Esta expresión no depende más que de w salvo por el hecho de que hemos 
escogido la antiimagen q' de p' . Sólo hay otra alternativa, pues p' no tiene 
más antiimágenes que q' y J(q'). Ahora bien, si en (11.3) sustituimos q' por 
J(q') el miembro derecho se convierte en uj(J(q')) actuando sobre los vectores 
dn( J(q'))~ 1 (vi), pero se cumple que J o n = n, y por consiguiente dn(q') = 
dJ(q')odTr(J(q')), luego dn(J(q'))~ 1 (v i ) = dJ(q')[dTr(q')~ 1 (v i )^j y, en definitiva, 
el miembro derecho de (11.3) se transforma en co(J(q')) actuando sobre los 
vectores dJ(q')^dn(q')~ 1 (vi)), pero esto es lo mismo que 



que da el mismo resultado, porque w € A + (S). 

De este modo, para cada punto p € P hemos construido una forma u p en 
un entorno que al actuar sobre un punto q' cualquiera da un resultado que sólo 
depende de w. Por lo tanto, dos formas uo p y u) p > coincidirán en su dominio 
común, luego la familia de formas que hemos definido determinan una única 
forma uo* € A p (P), que en un entorno de cada punto viene dada por (11.3). Es 
inmediato que tt^(lü*) = oj. ■ 

*Ejemplo El espacio proyectivo P"(R) puede identificarse con el espacio que 
resulta de identificar cada punto de S n con su antípoda. Como ya hemos co- 
mentado en el caso del plano, para considerarlo como variedad diferenciable 
necesitaríamos un concepto más abstracto de variedad que no exija que las 
variedades estén contenidas en M. m . De todos modos, P™(K) está localmente 
contenido en en el sentido de que una carta de S n que no cubra más de 

un hemisferio puede considerarse una carta de P™(E), lo que nos permite definir 
el espacio tangente de cada punto y, en general, todos los conceptos asociados 
a las variedades diferenciales. No vamos a entrar en detalles, pero si aceptamos 
que la proyección tt : S n — > P"(R) que a cada par de puntos antípodas les 
asigna una misma imagen en el espacio proyectivo es un difeomorfismo local, 
entonces el teorema anterior nos proporciona la cohomología de los espacios 
proyectivos, que resulta ser: 



Incidentalmente tenemos una prueba de que los espacios proyectivos de di- 
mensión par no son orientables, pues si lo fueran, al ser compactos, deberían 
cumplir H n ^ 0. ■ 

11.4 Aplicaciones al cálculo vectorial 

Tras los resultados de las secciones anteriores podemos afirmar que los abier- 
tos en IR" que cumplen condiciones como H 1 ^) = 0 son bastante frecuentes. 
Vamos a describir con un poco más de detalle las consecuencias de que los grupos 
de cohomología sean triviales. 



J«M(g , )(d7r(g , )- 1 (i;i) ) ...,d7r(g , )- 1 (« fc )) ) 



ií 0 (P n (K)) =R, ií fe (P"(IR)) = 0, l<fc<n, 
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Nota A la hora de dar aplicaciones, resulta conveniente observar que las 
hipótesis de diferenciabilidad pueden relajarse considerablemente. En efecto, 
en las secciones anteriores hemos trabajado únicamente con formas de clase C°° 
para que las cuestiones técnicas sobre diferenciabilidad no ocultaran las ideas 
fundamentales de la cohomología. No obstante, si S es una variedad de clase C°° 
(no vale la pena relajar esta hipótesis) podemos tomar como A(S) el álgebra de 
las formas diferenciales continuas y definir Z k (S) como el espacio de k- formas de 
clase C 1 con diferencial nula, F k (S) como el espacio de las diferenciales de k+ 1- 
formas de clase C 2 y H k (S) como el correspondiente espacio cociente. En estas 
condiciones A(S) no se ajusta a la definición de complejo, pues la diferencial 
sólo está definida en un subespacio de cada A k (S), el formado por las k- formas 
de clase C 1 , pero si el lector repasa las pruebas anteriores se convencerá de 
que todos los resultados valen en este contexto. 5 Así pues, cuando H k (S) = 0 
podemos asegurar que las fc-formas cerradas de clase C 1 son exactas. ■ 

La aplicación más elemental es la siguiente: 

Teorema 11.15 Sea U un abierto en R n tal que ií 1 (í7) = 0. Entonces un 
campo F : U — > R n de clase C 1 es de la forma F = V/ para una cierta 
función f : U — > R si y sólo si 



DEMOSTRACIÓN: Consideremos la 1-forma lü = Fi dx\ + ■ ■ ■ + F n dx n . El 
campo F es el gradiente de una función / si y sólo si w = df. Por hipótesis esto 
equivale a doj = 0 y, como 



Observemos que el teorema anterior afirma esencialmente que la condición 
necesaria que el teorema de Schwarz impone a los campos de gradientes es 
también suficiente (en los abiertos considerados). Conviene destacar los casos 
particulares correspondientes an = 2yn = 3: 

Teorema 11.16 Sea U un abierto en M 2 tal que H 1 (Í7) = 0. Entonces un 
campo F : U — > R 2 de clase C 1 es conservativo si y sólo si 



5 Las modificaciones son todas obvias. Por ejemplo, en la definición de homomorfismo de 
complejos hemos de exigir que las formas de clase C 1 se transformen en formas de clase C 1 . 
Lo mismo sucede en la definición de homotopía. Ahora, si h es una homotopía entre dos 
homomorfismos <f> y ip y ui es una fc-forma de clase C 1 , entonces <t>(t¿) — ip(u>) = d(/i(w)). 
Como el miembro izquierdo es de clase C 1 lo mismo le sucede al derecho, luego <¡>{lü) — tp(u>) es 
una cofrontera. Notar que las aplicaciones i(ei) e 1% conservan el grado de derivabilidad y la 
fórmula (11.1) vale para formas de clase C . Esto nos permite probar igualmente el teorema 
11.9, y observaciones similares se aplican a los resultados posteriores. 



dF\_dF ¿ 
dxj dxi ' 



para 1 < i < j < n. 




la condición dio = 0 equivale a la del enunciado. 



dh = dh 
dy dx ' 



11.4. Aplicaciones al cálculo vectorial 



415 



Teorema 11.17 Sea U un abierto en R 3 tal que -ff 1 (/7) = 0. Entonces un 
campo F : U — > K de clase C 1 es conservativo si y sólo si rot F = 0. 

Vimos en el capítulo anterior que si F es un campo de clase C 2 , entonces 
div rot F = 0. El teorema siguiente nos da un recíproco parcial: 

Teorema 11.18 Sea U un abierto en R 3 tal que H 2 (U) = 0 y sea F : U — > R 3 
un campo de clase C 1 . Entonces existe un campo G : U — > M 3 tal que F = rot G 
sí y sólo sí div F = 0. 

Demostración: Sabemos que d(d$(F)) = div Fdm, por lo que divF = 0 
equivale a que d$(F) = du>, para una cierta 1-forma w = Gdr, lo cual a su vez 
equivale a que F = rot G. ■ 

De aquí se siguen algunos resultados importantes sobre unicidad de un 
campo: 

Teorema 11.19 Sea F : R 3 — > IR 3 un campo de clase C 1 tal que div F = 
rotF = 0 y F tienda a 0 en infinito. Entonces F = 0. 

Demostración: Como rot F = 0 tenemos que F = V(/>, para cierta función 
0 : M 3 — > M de clase C 2 . Como A</> = divV^ = divF = 0, tenemos que <¡> es 
harmónica. Es inmediato comprobar que si <¡> es cualquier función de clase C 2 
se cumple 

dxi ^ ^ 9x¿ 

De aquí se sigue en nuestro caso que las derivadas parciales de <j>, es decir, las 
componentes de F son harmónicas. Ahora bien, vimos en el capítulo anterior 
que una función harmónica que tienda a 0 en infinito ha de ser nula, es decir, 
F = 0. ■ 

De aquí se sigue que si dos campos en R 3 se anulan en el infinito y tienen 
la misma divergencia y el mismo rotacional, entonces son iguales. (En realidad 
basta con que la diferencia tienda a 0 en el infinito.) Es natural preguntarse 
ahora si las ecuaciones div F = G, rot F = H tienen solución para dos campos 
G y H prefijados. Si imponemos a G y H las condiciones necesarias para que 
F se anule en el infinito la respuesta es afirmativa. Antes conviene probar otro 
resultado: 

Teorema 11.20 Sea F un campo de clase C 1 en R tal que div F tenga soporte 
compacto. Entonces F puede descomponerse como F = V + U, donde rot V = 0 
y divU = 0. 

Demostración: El campo V ha de ser de la forma V0, para una cierta 
función <j) de clase C 2 . Además A0 = div V = div F. Según vimos en el capítulo 
anterior, esta ecuación tiene como única solución el potencial newtoniano: 



* {x) = llw^\\ dmiy) - 
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Definimos, pues, 4> de esta manera yV = V</>. Por lo tanto definimos U = F— V. 
Entonces 

div U = div F — div V = A(j) - div V<^> = 0. 



En las condiciones del teorema anterior tenemos que V = V<fi y U = rot A, 
para una cierta función <¡> : R 3 — > IR y un cierto campo A : IR 3 — > IR 3 . A 0 
se le llama potencial escalar de F, mientras que A es el potencial vectorial de 
F. El primero está determinado salvo una constante, mientras que el segundo 
lo está salvo un gradiente. Podemos determinar completamente A si exigimos 
que div A = 0. 

Conviene definir el laplaciano vectorial de un campo A : IR 3 — > IR 3 como 
AA = V div A - rot rot A. 

Se comprueba que si A = (^1,^2,^3) entonces AA = (AAi, AA 2 , AA 3 ). 

Volviendo a nuestro caso, el potencial vectorial A de un campo F (determi- 
nado por la condición div A = 0) cumple AA = — rot rot A = — rot U = — rot F. 
Concluimos así que los potenciales <¡> y A de un campo F con divergencia de 
soporte compacto están determinados por las ecuaciones 

A(p = div F, AA = - rot F. 

Si rot F tiene también soporte compacto entonces la última ecuación vecto- 
rial equivale a tres ecuaciones escalares análogas a la primera, y las soluciones 
son los potenciales newtonianos de las componentes del rotacional. En definitiva 
tenemos 

, . 1 „ f divF , 1 f rotF , 

F(x) = -—V -rdm+— rot/ ¡rdm. 

4tt y R3 Hz-yH 4tt y R3 ||a: - y|| 

Teorema 11.21 Dados dos campos D : IR 3 — > IR y R : IR 3 — > IR 3 de c/ase C 2 
2/ de soporte compacto de modo que div i? = 0, exisíe un «meo campo vectorial 
F : IR 3 — ► R íaZ g«e div F = D y rot F = R. 

Demostración: Basta tomar A4> = D, AA = -R, F = V<^> + rot A. ■ 



Capítulo XII 

Funciones Harmónicas 



Las funciones harmónicas las introdujimos en el capítulo X, donde obtuvimos 
algunas de sus propiedades más importantes a partir de las fórmulas de Green. 
Recordemos que una función / de clase C 2 en un abierto de IR™ es harmónica si 
cumple la ecuación A/ = 0, conocida como ecuación de La-place. Las funciones 
harmónicas aparecen en muchos problemas físicos. Ya hemos visto su relación 
con los potenciales newtonianos. Por citar otro ejemplo, si V es la velocidad 
de un fluido incompresible (con densidad constante) sin fuentes ni sumideros 
(div V = 0) e irrotacional (rot V = 0, lo que equivale a que no forma remolinos), 
entonces V = V</>, para una cierta función <fi tal que A</> = div V = 0, es decir, 
el campo de velocidades se deriva de un potencial harmónico. 

Es obvio que las funciones harmónicas de una variable son exactamente 
las de la forma f(x) = ax + b. Más en general, todas las aplicaciones afines 
son harmónicas. Las propiedades básicas de las funciones harmónicas pueden 
verse como generalización de propiedades obvias de las rectas. Por ejemplo, 
si conocemos los valores que toma una recta en los extremos de un intervalo 
conocemos también los valores que toma en el interior del mismo. Igualmente 
sucede que una función harmónica en un abierto acotado está determinada por 
los valores que toma en la frontera. Esto lo probamos en el capítulo X, al igual 
que esta relación más concreta: 

Teorema 12.1 (Teorema del valor medio de Gauss) Si Xo £ K™ y una 

función f : B r (x 0 ) — > R es continua en B r (x 0 ) y harmónica en dB r (x 0 ), 



Esta propiedad generaliza al hecho obvio de que una recta toma en el centro 
de un intervalo la media aritmética de los valores que toma en sus extremos. 

Paralelamente a estos resultados de unicidad, existen resultados de existen- 
cia, es decir, dada una función continua sobre la frontera de un abierto fl, ¿puede 
extenderse a una función harmónica en fl y continua ffi Esta cuestión se conoce 



entonces 
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como problema de Dirichlet para íi, y entre otras cosas probaremos que tiene 
solución positiva en una familia muy amplia de abiertos. 



12.1 El problema de Dirichlet sobre una bola 

En esta sección resolveremos explícitamente el problema de Dirichlet para 
una bola, es decir, dada una función continua sobre una esfera, veremos cómo 
extenderla a una función continua sobre la bola que limita y harmónica en su 
interior. Primeramente demostramos un resultado básico sobre existencia de 
funciones harmónicas: 

Teorema 12.2 Las únicas funciones harmónicas en R n de la forma <7(||x||) son 
las de la forma 

2 + B sin ^2 



\m\ 

Alog + -B sin = 2 



DEMOSTRACIÓN: Sea / una función de la forma indicada. La función g es 
de clase C 2 en su dominio, pues / lo es y g(r) = f(r, 0, . . . , 0). Por consiguiente 

d¿ = dgXi_ dy = d 2 g^ dgfj_ _x¡ 
dx, dr \\x\\' dx 2 dr 2 \\x\\ 2 dr \\\x\\ \\x\ 

luego 

A/ ^® + ^ U ~ ^ 0 

dr 2 dr \\x\\ 

Esta ecuación se cumple para todo x ^ 0 en el dominio de /, de donde se 
sigue claramente que 

d 2 q dq n — 1 

— - + — = 0 

dr 2 dr r 

para todo r ^ 0 en el dominio de g. En el ejemplo de la página 247 vimos que 
las únicas soluciones de esta ecuación son las de la forma 



9(r) 



+ B sin^2 



A log r + B si n = 2 

de donde se sigue que / tiene la forma indicada. ■ 

Consideremos la bola abierta de centro 0 y radio r en IR™ y una función 
continua / : dB r (0) — > R. Queremos extenderla a una función continua que 
sea harmónica en B r (0) (tomamos centro 0 por simplificar la notación, pero 
todo vale igualmente para un centro arbitrario). Para ello nos valdremos de la 
función 

\\x - y\\ n 
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Una comprobación rutinaria muestra que, para cada y £ IR" fijo y todo 
x ^ y se cumple A X H = 0, donde A X H representa el laplaciano de la función 
x i ^ H{x 1 y). Definimos 

u f (x) = — 1 — / H(x,y)f(y)da(y), para ||x|| < r, 

r<Tn-l J\\y\\=r 

donde ct„_i es la medida de Lebesgue de dBi(0). Como podemos derivar bajo 
la integral, es claro que Auj es harmónica en B r (0). Vamos a probar que si 
z G dB r (0), entonces existe 

lím Uf(x) = f(z). 

Esto prueba que si extendemos Uf a la frontera de la bola como u¡(z) = f(z) 
obtenemos una extensión continua de /, que resuelve el problema de Dirichlet. 
Consideremos primero el caso en que / = 1. Entonces 

Sea h el giro de centro 0 que cumple /i(||x||ei) = x, donde e\ es el primer 
vector de la base canónica. Aplicando el teorema de cambio de variable resulta 
que 

ui{x) = / — r do-(y) = m( a; ei), 

r(?n-i J\\y\\= r IIMlFll e i) - %)H 

luego si llamamos g(r) = ui(rei) hemos probado que wi(x) = luego u\ 

tiene la forma indicada en el teorema anterior. Ahora bien, u\ está definida en 
0, luego la única posibilidad es que u\ sea constante. Es fácil ver que Ui(0) = 1, 
luego U\ = 1. Volvamos ahora al caso general. Fijemos un punto tal que ||z|| = r. 

Como / es continua en z, dado e > 0 existe un S > 0 tal que si \\y — z\\ < S 
entonces \f(y) — f(z)\ < e/2. Tomemos ||x|| < r tal que — z\\ < 6/2. Entonces 

u f (x)-f(z)=u f (x)-f(z) Ul (x) = - 1 — / r '-^f n (f( y )-f(z))da(y). 

r<T n -\ J\\y\\=r \\ X - y\\ 

Descomponemos en dos partes la integral. La primera sobre el conjunto 
de los puntos que cumplen \\y — z\\ > 6 y la segunda sobre los que cumplen 
II 2/ - z\\ < S. 

En el primer caso tenemos 5 < \\y— z\\ < \\x — y\\ + \\y — z\\ < \\x — y\\ + 6/2, 
luego \\x — y\\ > 6/2. Así pues, si M es una cota de /, 

\u f (x)-f(z)\ < ^ {r *-\\xf)( 2 X +-^- f "^Idviy) 
ro n -i \o J 2ro n -\ J\\ y \\= r \\x - y\\ n 

^ 2M . 2 ||2 . (2\ n e 

< (r 2 ~ x 2 - +-. 

ra n -i \ó J 2 

Si tomamos x suficientemente próximo a z podemos exigir que el primer 
sumando sea menor que e/2, con lo que obtenemos \uf(x) — f(z)\ < e. Con esto 
hemos probado el teorema siguiente: 
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Teorema 12.3 Sea f : dB r (xo) C IR™ — > K™ «na función continua. Entonces 
existe una única función continua u¡ : B r (x 0 ) — > K gwe extiende a f y es 
harmónica en B r (xo). En los puntos interiores de la bola Uf viene dada por 

u f (x) = ¡ H(x - x Q , y) f{y) da (y). 

ra n ^i J\\y- Xo \\= r 

De aquí se desprenden muchas consecuencias. La unicidad de la extensión 
nos da inmediatamente la siguiente propiedad de las funciones harmónicas, que 
generaliza al teorema de Gauss: 

Teorema 12.4 Sea f : fl — > R una función harmónica en un abierto de R n , 
sea x 0 € fl y r > 0 tal que B r (xo) C fl. Entonces si \\x\\ < r se cumple 

f(x) = — 1 — ( H(x -x 0 ,y- x 0 ) f(y) da (y), 

rvn-i J\\y 



El teorema 7.23 puede aplicarse indefinidamente a esta integral, lo que 
prueba que las funciones harmónicas son siempre de clase C°° . Las derivadas 
parciales conmutan obviamente con el laplaciano, luego las derivadas parciales 
de cualquier orden de una función harmónica son funciones harmónicas. La 
fórmula anterior nos da una información más precisa sobre las derivadas de una 
función harmónica, de la que sacaremos consecuencias importantes: 

Teorema 12.5 Sea w un abierto en R n , sea f : fl — > R una función continua 
enfly harmónica en fl. Para cada punto x € fl sea d{x) = d(x, dfl). Entonces 



df , , 
dx~^ ] 



Ti 

- ir~\ sup 



Demostración: Tomemos 0 < r < d(xo) y apliquemos el teorema anterior 
en la bola B r (x 0 ). Derivando resulta 



df 1 f f-2(xi-x 0i ) r 2 -||x-x 0 | 12 



— / 

*n-l J\\y- 



dx t ra n _i J\\y_ X0 \\ =r \ \\x-y\\ n ' \\x - y||™+ 2 
luego 



{xí - y%) f{y) da, 



dx~ {X0) 



~ a i"r"+i / \*0i-Vi\\f(v)\do- 

On-V J\\y-x 0 \\=r 
Tí Tí 

< - sup \f(y)\ < - sup \f(y)\. 

r \\v-x 0 \\=r r yedn 



La última desigualdad se basa en que / no puede tomar un valor máximo o 
mínimo en Í2, sino que los valores máximos y mínimos los toma en d£l, como se 
deduce fácilmente del teorema del valor medio de Gauss. Si Í7 no es compacto el 
supremo puede ser infinito. Puesto que la desigualdad vale para todo r < d(xo), 
también se cumple para d(xo). m 

Como aplicación probamos lo siguiente: 
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Teorema 12.6 Sea íl un abierto en IR™ y {f n }'¡ÍLa una sucesión de funciones 
harmónicas en íl que converge uniformemente a una función f. Entonces f es 
harmónica en íl. Además la sucesión {Dif n } converge uniformemente a Dif. 

DEMOSTRACIÓN: Tomemos un punto x € íl y apliquemos el teorema an- 
terior a una bola cerrada de centro x contenida en íl. Puesto que {/ n }^Lo 
converge uniformemente en la frontera, es claro que la sucesión {D¿/ n }^L 0 es 
uniformemente de Cauchy en la bola cerrada, luego converge uniformemente a 
una función g, que por el teorema 3.28 es Dif . Así pues, / es de clase C 1 en 
íl. Como las funciones {Dif n } también son harmónicas en la bola abierta, el 
mismo razonamiento prueba que Dif es de clase C 2 . Concretamente, las segun- 
das parciales de / en la bola son el límite uniforme de las segundas parciales de 
las /„, luego A/ es el límite de A/„, luego A/ = 0. ■ 

Otra aplicación importante del teorema 12.5 es el hecho de que una función 
harmónica en todo R™ no puede estar acotada: 

Teorema 12.7 (Teorema de Liouville) Si f : IR™ — > IR es harmónica y 
acotada entonces es constante. 

Demostración: Aplicamos 12.5 en la bola de centro x y radio r, con lo 
que obtenemos 



df 



dx, 



nM 

— ; 
r 



donde M es una cota de /. Como r es arbitrario concluimos que V/ = 0, luego 
/ es constante. ■ 



12.2 Funciones holomorfas 

Las funciones harmónicas están estrechamente relacionadas con las funciones 
holomorfas, que son las funciones de variable compleja análogas a las funciones 
derivables en IR. La definición que enlaza mejor con el cálculo diferencial que 
estamos estudiando es la siguiente: 

Definición 12.8 Sea íl C C™ un abierto. Una función / : íl — > C" 1 es 

holomorfa si considerada como aplicación / : íl C IR 2 ™ — > IR 2 ™ 1 es de clase 
C 1 y, para cada z G íl, la diferencial df(z) : C™ — > C" 1 es C-lineal. 

A partir de esta definición es obvio que la composición de funciones ho- 
lomorfas es de nuevo una función holomorfa. También es fácil ver que una 
función / : íl — > C" 1 es holomorfa si y sólo si lo son sus funciones coordenadas 
fi : íl — > C. Por ello nos limitaremos a estudiar funciones con valores en C. 

Veamos qué ha de cumplir una aplicación IR-lineal g : C™ — > C para que sea 
C-lineal. Si es C-lineal entonces g(z\, . . . , z n ) = c\Z\ + • • • + c n z n , para ciertos 
números complejos c¿ = a¿ + Si llamamos z¿ = x¿ + zy¿ entonces 

g(xi,yi. . .,x„,y„) = (a í x í -b í y í ^ Va n x n — b n y n , a\y\ +b\X\ H \-a n y n + b n x n ), 
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luego la matriz de g es 



/ a x 61 \ 
-bi ai 



V -K a„ / 

Recíprocamente, si la matriz de g es de esta forma — para números reales 
cualesquiera a¿ y 6¿ — entonces g es C-lineal. 

Si aplicamos esto al caso en que g = df(z) obtenemos el teorema siguiente: 

Teorema 12.9 Sea íl C R™ un conjunto abierto y f : íl — > C una función de 
clase C . Entonces f es holomorfa en íl si y sólo si satisface las ecuaciones de 
C auchy-Riemann : 



d Re/ dlmf d Re/ 



dxi 



dyi 



En tal caso 



df = |^ dz x 
azi 



dz n 



dlmf 

dxi 



dz 



dond 



e usamos 



notación 
df = ORef 

dzi 



+ i 



. dlmf 



dzi = dxi + idyi 



dxi dxi 

Las igualdades entre diferenciales han de entenderse como elementos del 
espacio A 1 (íi) de todas las aplicaciones de fl en el espacio de aplicaciones R- 
lineales de C™ en C (con las operaciones definidas de forma obvia). Las llamare- 
mos 1-formas complejas. Para el caso de funciones de una variable es costumbre 
escribir 

— (z) en lugar de — ( 

Notemos que la derivada parcial respecto de z¿ de una función holomorfa / en un 
punto (zi, . . . , z n ) es la derivada de la función z f{z\, . . . , Zi_\,z, z i+í , . . . , z n ). 



/'(*) 



-(z). 



Ejemplo Recordemos que la función exponencial compleja viene dada por 
e z = e x+ly = e x (eos y + i sen y ) . 
Ciertamente se trata de una función de clase C 1 en C y 



dRee z 

dx 
d Im e 2 

dx 



e eos y, 



e sen y, 



dRee z 

dy 
d Im e 2 
dy 



-e sen y, 



e eos y. 



Vemos que e 2 cumple las ecuaciones de Cauchy-Riemann y por consiguiente 
es una función holomorfa en C. Su derivada es 

de 2 <9Ree 2 .<9Ime 2 „ „ , 

—— = — h 1 — = e eos y + ie sen y = e . 

dz dx dx 
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En general, si / es una función holomorfa en un abierto de C que extiende 
a una función real g : I — > IR, para un cierto intervalo /, es decir, si Re/|j = g 
e Img|/ = 0, para todo x € I tenemos que 

„. . , d Re / . , .dlmf . . ... 

es decir, si una función holomorfa / extiende a una función real g, entonces la 
derivada compleja de / extiende a la derivada real de g. 

Llamaremos al conjunto de todas las funciones holomorfas en el abierto 

íl C C™ . Es claro que la suma de funciones holomorfas es holomorfa, así como el 
producto de un número complejo por una función holomorfa, más aún, se cumple 
la relación d{a\f + a 2 g) = o¿idf + a 2 dg, con lo que IK(Í2) tiene estructura de 
C-espacio vectorial. En el caso de una variable tenemos la regla de derivación 
(ai/ + a 2 g)' = a.\f + a 2 g' . 

El producto de funciones holomorfas también es una función holomorfa. Para 
probarlo consideramos la aplicación / : C 2 — > C dada por f{z\,z 2 ) = z x z 2 = 
x\x 2 - yiy 2 + i(xiy 2 + x 2 yi). Es claro que 

<9Re/_ _ d\mf dRe f _ dlmf 
oxi dyi dyi dx ± 

dRef _ _dlmf dRe f _ dlmf 
ox 2 dy 2 óy 2 dx 2 

luego z\z 2 es holomorfa y d{z\z 2 ) — z 2 dzi + zi dz 2 . Usando la regla de la cadena 
deducimos que si /, g € Jí(fi) entonces fg € Jí(íi) y d(fg) = f dg + gdf. Esto 
implica que J£ (fl) tiene estructura de álgebra. En el caso de funciones de una 
variable tenemos la regla usual de derivación de productos. Ahora es evidente 
que el anillo de polinomios C[zi, . . . , z n ] está contenido en 5í(C"). 

Ejercicio: Probar que la función l/z es holomorfa en C \ {0} y d(í/z) — (—l/z 2 ) dz. 
Concluir que si / : Í7 C C n — > C es una función holomorfa que no se anula, entonces 
1/ f(z) es también holomorfa. 

Ejercicio: Probar que las funciones senz y cosz son holomorfas, así como que 
(sen 2)' = cosz, (eos z)' — — sen z. 

Sea C C un conjunto abierto. Toda 1-forma compleja en Í7 es de la forma 
lo = Re + ilmuj, donde Retu e Imuj son dos 1-formas reales en Í2. Si lo es de 
clase C 1 (es decir, si lo son sus partes real e imaginaria) definimos la 2-forma 
compleja dw — dReiv + idlmu;. Si / : fl — > C es una función holomorfa 
podemos considerar la 1-forma 

f(z) dz = (Re f(z) dx - Im f(z) dy) + ¿(Re f(z) dy + Im f{z) dx) . 

Las ecuaciones de Cauchy-Riemann implican que d(f(z) dz) = 0. Por con- 
siguiente, si ií 1 (íl) = 0 podemos concluir que existe una 0-forma compleja 
g = Re g + i Im g de clase C 1 en fl de modo que 

^ rr \ 1 t x , dReg , dReg , 
Re f(z) dx - Im f(z) dy = ^ dx + ^ dy, 
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Re f(z) dy + Im f(z) dx = 



dlmg 



dx + 



dlmg 



dy. 



dx 



dy 



Así pues, g cumple las ecuaciones de Cauchy-Riemann y es, por tanto, una 
función holomorfa. Además f(z) = g'(z). Más aún, AReg = Almg = 0, 
es decir, Re g e Img son funciones harmónicas, luego también lo son Re / e 
Im/. Si ií 1 (f2) t¿ 0 las conclusiones siguen siendo válidas porque son locales, 
es decir, podemos restringir / a una bola de centro un punto arbitrario de 
y así obtenemos que / es de clase C°° en dicha bola, que las funciones Re / e 
Im / son harmónicas y además (una vez asegurada la derivabilidad de /') las 
ecuaciones de Cauchy-Riemann implican que /' es holomorfa. 

Más aún, si / : Cl C C" — > C es holomorfa y z ~ (z\, . . . , z n ) € Q, podemos 
aplicar el razonamiento anterior a las funciones que fijan todas las componentes 
de z menos una, con lo cual obtenemos: 

Teorema 12.10 Si f : fl — > C es una función holomorfa en un abierto de 
C n , entonces f es de clase C°° en fl, Re/ e Im / son funciones harmónicas y 
las derivadas parciales de f son también holomorfas. 

Vemos, pues, que las funciones holomorfas son infinitamente derivables. Más 
aún, todas las propiedades de las funciones harmónicas se traducen a propie- 
dades análogas de las funciones holomorfas. Por ejemplo, el teorema 12.6 nos 



Teorema 12.11 (Teorema de Weierstrass) Si {f n }^ = o es una sucesión de 
funciones holomorfas en un abierto Q C C que converge uniformemente en los 
subconjuntos compactos defla una función f : fl — > C entonces f es holomorfa 
eníl y {f' n } converge a f uniformemente en los compactos de fl. 

Basta observar que la convergencia uniforme de {/«} a / equivale a que 
{Re/„} converja uniformemente a Re / e {Im/„} converja uniformemente a 
Im/. La posibilidad de relajar la convergencia uniforme de 12.6 a la conver- 
gencia uniforme en compactos es clara, y de este modo el teorema es aplicable 
a las series de potencias (ver 3.26), de donde resulta que todas las funciones 
definidas por series de potencias son holomorfas. Así tenemos otra prueba de 
que las funciones e z , senz, cosí; son holomorfas. 

Ejemplo El teorema de Liouville vale para funciones holomorfas en C, lo 
cual tiene una aplicación clásica: el teorema fundamental del álgebra. Si un 
polinomio no constante P{z) no tuviera raíces complejas entonces 1/P(z) sería 
una función holomorfa y acotada en C, lo cual es imposible. ■ 

Vamos a dar un último resultado sobre funciones de varias variables comple- 
jas. Después nos restringiremos al caso de una variable porque es el de mayor 
interés y las ideas fundamentales se ven así más claramente. 



da: 



Teorema 12.12 Sea fl un abierto en C tal que ií 1 (íi) = 0. Entonces toda 
función harmónica en fl es la parte real de una función holomorfa. 
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DEMOSTRACIÓN: Sea / : íi — > IR una función harmónica. Hemos de probar 
que existe una función g : fl — > IR de modo que / + ig sea holomorfa, es decir, 
que sea de clase C 1 y cumpla 

dg_ = 9/ dg_ = df_ 
dx dy' dy dx 

La existencia de g se sigue inmediatamente del teorema 11.15. ■ 

Si dos funciones harmónicas / y g cumplen que f + ig es una función holo- 
morfa se dice que son funciones harmónicas conjugadas. Es fácil ver que se trata 
de una relación simétrica y que dos conjugadas de una misma función se diferen- 
cian en una constante. El teorema anterior prueba que toda función harmónica 
en un abierto en C de cohomología trivial tiene una función harmónica conju- 
gada. 

Vamos a necesitar algunos hechos elementales sobre integración de funciones 
complejas. Supongamos que C C C es una 1-variedad orientable (de hecho, 
toda 1-variedad es orientable). Si u> es una 1-forma compleja en C, diremos que 
es integrable si lo son Rew e Imw, y en tal caso definimos su integral como 

üj = / Reuj + i Imu. 
c Je Je 

Es fácil ver que la integral así definida es C-lineal. Diremos que una función 
/ : C — > C es integrable si lo es la 1-forma f(z) dz, en cuyo caso definimos la 
integral de / como la de dicha forma. 

Antes hemos comprobado que si / es una función holomorfa en un abierto 
fl, entonces d(f dz) = 0, luego aplicando el teorema de Stokes a la parte real y 
a la parte imaginaria de la integral obtenemos el teorema siguiente: 

Teorema 12.13 Sea Í2 un abierto acotado en C tal que sea una 2-variedad 
con frontera. Sea f una función holomorfa definida en un abierto que contenga 
a íl. Entonces 

f f(z)dz = Q. 
Jdn 

De aquí se desprenden propiedades muy importantes de las funciones holo- 
morfas. Para obtenerlas necesitamos algunos hechos básicos sobre integrales de 
funciones complejas. Ante todo, a efectos de cálculo es conveniente transformar 
las integrales sobre 1- variedades en integrales sobre arcos. Supongamos que 
7 : [a, b] — > C es una aplicación de clase C 1 (en el sentido de que se extiende a 
una aplicación de clase C 1 sobre un intervalo que contiene a [a, b]) y de modo 
que su restricción a ]a, b[ sea una carta de la 1-variedad C C C que cubra todos 
sus puntos salvo a lo sumo un número finito de ellos. 1 Entonces es fácil ver que 



/ f(z)dz= t f{l{t))i{t)dt, 

JC Ja 



1 Todas las integrales sobre una 1- variedad se pueden reducir en la práctica a integrales 
sobre variedades en estas condiciones. El caso típico es 7(4) = 20 + re lí , con í £ [0, 2ir\, que 
cubre a toda la circunferencia de centro zq y radio r menos un punto. 
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donde la última integral se interpreta como el número complejo que se obtiene 
integrando por separado la parte real y la parte imaginaria del integrando. 

Conviene observar que el miembro derecho tiene sentido aunque 7 no sea la 
carta de ninguna variedad. Basta con que 7 sea una aplicación de clase C 1 (no 
necesariamente inyectiva) y / una aplicación continua sobre la imagen de 7. En 
estas condiciones representaremos la integral por 



f(z)dz. 



Como primer hecho importante notamos que el teorema 7.23 es aplicable 
para derivar integrales de funciones complejas: Si 7 es un arco, K C C es su 
imagen y / : Q, x K — > C es una función tal que /( , £) es holomorfa en Í7 para 
cada C £ K, entonces la función F(z) = f(z, Q d( es holomorfa en fl y 



Basta aplicar 7.23 para comprobar que F tiene derivadas parciales y éstas 
cumplen las ecuaciones de Cauchy-Riemann. 

Si h : [a, b] — > C es una función continua se cumple la desigualdad 



pb í-b 
l h(t)dt < / \h(t)\dt. 
Ja Ja 



En efecto: Si la integral de h es nula la desigualdad es obvia. En otro caso 



sea 



a = 



¡ b a h(t)dt 



I>(t)dt 



e C. 



Entonces 



pb pb pb 

/ h(t) dt =a h{t) dt= ah(t) dt, 

Ja Ja Ja 



pero como se trata de un número real, en realidad ha de ser 



h(t) dt 



Re(a 



h{t))dt< í \h(t)\ 

J a 



dt, 



pues Rez < \z\ y \a\ = 1. 

Aplicado a la integral de una función / sobre un arco 7 tenemos 



/ f(z)dz 



< 



[ b \mt))\h'(t)\ 

J a 



dt. 



12.2. Funciones holomorfas 



427 



Ahora notamos que |7'(í)|dí es el elemento de longitud (no orientada) de 
7, es decir, la medida de Lebesgue. Si convenimos en representarlo por \dz\ la 
desigualdad anterior se escribe mejor de este modo: 



/ f(z)dz < i |/( 

J y J y 



\dz\. 



Si 7 es una carta que cubre casi todos los puntos de una 1-variedad C, entonces la 
última integral es simplemente la integral de / respecto a la medida de Lebesgue 
en C. 

Una consecuencia es que si {/ n }^Li es una sucesión de funciones continuas 
que convergen uniformemente en el rango de un arco 7 a una función /, entonces 



/ f{z)dz = lím / f n {z)dz. 



En efecto, dado e > 0 existe un natural no tal que si n > rio entonces 
\f n (z) — fn 0 (z)\ < e/L(-f), donde L(-f) es la longitud de 7. Por lo tanto 



ff(z)dz- í f n {z)dz < í \f( Z ) - f n ( Z )\\dz\ 
Jy J y Jy 



< e. 



Una simple comprobación muestra que la regla de Barrow es válida para 
integrales complejas, es decir, 

f f(z)dz = f{ 1 (b))-f{ 1 (a)). 

J y 

En particular, si 7(6) = 7(0) entonces f'(z) tiene integral nula sobre 7. 

Hemos visto que si íf 1 (fí) = 0 entonces toda función / holomorfa en fl tiene 
una primitiva, luego f(z) dz = 0, para todo arco cerrado 7 en íl. Esto se 
conoce como teorema de Cauchy. Por supuesto, la hipótesis cohomológica es 
esencial, como muestra el ejemplo siguiente: 



Ejemplo Vamos a probar que si z 0 € C, r > 0 y n € Z entonces 

/ (c-^ 0 )"rfc = {° . si . n ^-\ 

J\C-z a \=r 1 2m si n = -1 

En efecto, se entiende que la integral se calcula sobre la circunferencia de 
centro Zq y radio r con la orientación usual (en sentido antihorario), de modo 
que una carta positiva es Q = z 0 + re lt , para t € [0, 2ir), luego 

f 1 ,, f 271 ire u , n . 
/ dC = / — T dt = 2m. 

J\(-z„\=r C-za Jo re lt 
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Por otra parte, si n ^ — 1 la función (z — z 0 ) n tiene primitiva en C \ {0}, 
concretamente la función 

n+l ' 

luego la regla de Barrow implica que la integral es nula. ■ 

En particular 1/z es un ejemplo de función holomorfa en C \ {0} que no 
tiene primitiva en dicho abierto. El resultado que acabamos de probar tiene 
consecuencias muy importantes. Para empezar tenemos lo siguiente: 



Teorema 12.14 (Fórmula integral de Cauchy) Sea f : íl 



C una fun- 
ción holomorfa en un abierto Q que contenga una bola cerrada B r (zo) . Entonces, 
si \z — z 0 \ < r y n es un número natural se cumple 



™ Jk 



f(0 



2m J\c- Za \= r (C - zo) n+1 



d(. 



DEMOSTRACIÓN: Probemos primero el caso n = 0 y z = z 0 . En primer 
lugar observamos que el teorema 12.13 implica que la integral 



IC-zol 



/(C) 

=r C - z 0 



no depende de r, pues si tomamos dos radios distintos, las circunferencias que 
determinan (con orientaciones contrarias) son la frontera del anillo comprendido 
entre ambas, y el integrando es una función holomorfa en la clausura de dicho 
anillo. 

Sea e > 0 y tomemos r suficientemente pequeño para que si \( — zq\ = r 
entonces |/(C) — f( z o)\ < e - Teniendo en cuenta el ejemplo anterior, 



1 

2^i 



IC-zo|=r 



/(C) 

C - z 0 



d( ~ f{zo) 



<-/ 



l/(C)-/(^o)| 



z 0 \=r 



\dC\< 



2m J k 



ñO-f(zo) 
C- zo 



2irr 



L 



\d(\ 



Como esto se cumple para todo e, concluimos que se da la igualdad buscada. 
Consideremos ahora un punto z tal que \z — z 0 \ <ry tomemos un radio s tal 
que B s (z) C B r (z 0 ). Entonces el teorema 12.13 junto con la parte ya probada 
implica que 



2m J\C-zo\ 



/(C) 



2tt« J\c-z\=s 



/(O 



<*C = /(*), 



pues las dos circunferencias constituyen la frontera del abierto B r (zo) \ B s (z). 
La fórmula para n arbitrario se obtiene derivando ésta. ■ 
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Introducimos ahora un nuevo concepto que nos permitirá generalizar nota- 
blemente estas fórmulas. Consideremos una serie funcional de la forma 

+00 

y^- , (12.1) 

donde a_„, z 0 € C. La función h(z) = l/(z — z 0 ) es un homeomorfismo de 
C \ {z 0 } en C \ {0} (su inversa es h~ 1 (z) = z 0 + l/z). Es claro que la serie 
anterior converge (absolutamente) en un punto z ^ z 0 si y sólo si la serie de 
potencias 



,a- n z- 

n=l 

converge (absolutamente) en h(z) (y la suma es la misma). Puesto que esta serie 
converge absolutamente en un disco de la forma B £ (0) (= C si e = 00) y diverge 
fuera de la clausura del mismo (teorema 3.26), concluimos que la serie original 
converge absolutamente en el abierto A = /i _1 [_B e (0)] = {z € C | \z — Zo\ > r} 
(donde r = 1/e) y diverge fuera de la clausura del mismo (supuesto e > 0 y con 
el convenio l/oo = 0). Más aún, si K es un subconjunto compacto de A, la 
serie de potencias converge uniformemente en h[K], de donde se sigue fácilmente 
que la serie original converge uniformemente en K. El teorema de Weierstrass 
implica que (12.1) define una función holomorfa sobre los números z tales que 
\z — zo\ > r. Consideremos ahora una serie de potencias 

00 

^a„(z - z 0 ) n . 

Si su radio de convergencia R es mayor que r, entonces podemos considerar 
la función holomorfa 

+00 +00 00 

f( Z )= y, an(z- Zo r = y ¿rh„ + XX* -*>)". 

n— — 00 n=l n— 0 

definida sobre el anillo A(z 0 ,r,R) = {z G C | r < \z — zq\ < R}, donde quizá 
R = +00. Estas series dobles reciben el nombre de series de Laurent. Las series 

00 00 

Va„(z-z 0 )", V, 

(Z — Zn) 

n=0 n=l y VJ 

reciben el nombre de parte regular y parte singular, respectivamente, de la serie 
de Laurent. 

Los razonamientos anteriores muestran que si una serie de Laurent converge 
en un abierto (en el sentido de que lo hacen sus partes regular y singular) en- 
tonces converge en un anillo A(zo,r, R). La convergencia es absoluta y uniforme 
en los compactos. Además la serie diverge fuera de la clausura del anillo. 

Ahora es fácil ver que los coeficientes de una serie de Laurent convergente 
en un anillo están completamente determinados por la función holomorfa que 
determina: 
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Teorema 12.15 Supongamos que una serie de Laurent 

+ OG 

^2 a n(z - Z 0 ) n 

Ti — — OO 

converge en un anillo A(zq, r, R) a una función f. Sea r < p < R. Entonces 

/(O 



!\C-zo\=p (C-¿o)" +1 
Demostración: La serie de Laurent 



/(C) 

(C-^o)' 



^+l = Yl a n(z-Z 0 ) 



n—m—1 



n— — oo 



converge obviamente en el mismo anillo que /, y la convergencia es uniforme en 
la circunferencia de radio p. Por lo tanto podemos intercambiar la integral con 
la suma: 



J\C-z 0 \= P (C - zo) n+L n ^ Jk-z 0 \=p 

pues todos los sumandos son nulos excepto el correspondiente a n = m, según 
hemos visto anteriormente. ■ 

Lo verdaderamente notable es que toda función holomorfa en un anillo ad- 
mite un desarrollo en serie de Laurent: 

Teorema 12.16 Sea f una función holomorfa en el anillo A(zo,r,R), donde 
z 0 € C y 0 < r < R < +oo. Sea r < p < R y para cada n € Z sea 



2ni L 



/(O 



A- 



| C -z„|=p (C-¿0)" +1 

Entonces 

f{z) = a n (z — z 0 ) n , para r < \z\ < R. 



DEMOSTRACIÓN: El teorema de 12.13 implica que a n es independiente de 
la elección de p. Dado z € A(z 0 ,r, R) tomamos r < pi < \z\ < p 2 < R- Ahora 
aplicamos el teorema 12.13 al anillo limitado por las circunferencias de centro zo 
y radios p\ y p 2 menos un disco de centro z y radio e suficientemente pequeño 
para que su clausura esté contenida en dicho anillo. Obtenemos que 



2ni J\ ( ~ z \ = e (-z 

\C-z 0 \= P2 (-z 2ni J K _ Zol=pi C-z 
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f(0 



d(- 



2 ™ J\c-z a \=P2 (C - z o) ~{z- zq) 2-kí J K _ Zol=pi (C - z 0 ) - (z - z 0 ) 



/(C) 



1 

2^¡ 



|C-«o|=P2 



/(C) 

c-*>i-§Ef 



+ 



-/ 

2m J k 



f(0 d( 



\C-z 0 \= Pl z - z 0 1 



+ 



1 

2tt¡ 

1 

2tt¡ 



|C-Zo|=P2 



/(O 

C - zo 



£ 

CSO 



/(O v 



|z-* 0 |=pi z ~ z o ^ \ z-z 0 



z - z 0 
C - z 0 

C - z 0 



d(. 



Para intercambiar las sumas con las integrales hemos de justificar que las 
series convergen uniformemente en las circunferencias. Esto se sigue del criterio 
de mayoración de Weierstrass. Por ejemplo, para la primera tenemos 



/(C) 



z - z 0 



C - z 0 VC - z 0 



< 



M (\z- z 0 



P2 



92 



y la sucesión de la derecha es una progresión geométrica de razón menor que 1, 
luego determina una serie convergente. Con la segunda serie se razona igual- 
mente. Así pues, 



f(z) 



V — ( í m 

h 2m Uc-oi=p 2 (c-z 0 )" +i 



dC)(z- z 0 )' 



+ 



§ 2 - U 



|C-^o|=P2 

= ^2 a «( z ~ z o) n - 



/(c)(c-z 0 m (z-z 0 ) 



-n-1 



Definición 12.17 Sea / : — > C una función holomorfa. Diremos que un 
punto z 0 es una singularidad aislada de / si B r (z 0 ) \ {z 0 } C fl para cierto radio 
r > 0. 

Es decir, zo es una singularidad aislada de / si / está definida alrededor de 
z 0 (pero tal vez no en z 0 ). Puesto que B r (zo) \ {zo} = A(z o ,0,r), el teorema 
anterior implica que / admite un desarrollo en serie de Laurent 

f( z )= ^2 a n (z-z 0 ) n , para 0 < |z - z 0 | < r. 

n— — oo 

Los coeficientes a n están unívocamente determinados por /, luego podemos 
definir el orden de / en z 0 como 



o(/, z 0 ) = ínf{n G Z | a„ ^ 0}, 
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entendiendo que o(f, z 0 ) = +00 si a n = 0 para todo n y o(f, z 0 ) = —00 si hay 
coeficientes a_„ = 0 para n arbitrariamente grande. 

Veamos la información que nos da el orden de una singularidad aislada. Si 
o(f, zq) > 0 entonces la serie de Laurent es en realidad una serie de potencias, 
definida también en zq, por lo que / se extiende a una función holomorfa en 
ílU{z 0 }. Concretamente f(zo) = a 0 . Mas en general, la fórmula de Cauchy nos 
da que si n > 0 entonces 



es decir, la serie de Laurent de / es precisamente su serie de Taylor. Ahora 
sabemos que la serie converge a / en todo disco abierto de centro zq contenido 
en fl. Cuando o(f, z 0 ) > 0 se dice que z 0 es una singularidad evitable de /. 

En general, si o(f, zq) = n £ Z, podemos extraer un término (z — Zo) n de 
la serie de Laurent, de modo que nos queda una serie de potencias con primer 
coeficiente no nulo, es decir, f(z) = (z — z 0 ) n g(z), donde g(z) es una función 
holomorfa definida en un entorno de zq y tal que g(zo) ^ 0. La unicidad de la 
serie de Laurent implica fácilmente que esta descomposición es única. 

Si o(f, z 0 ) = n > 0 se dice que Zq es un cero de orden n de /. Notemos 
que si / es un polinomio este concepto de orden de un cero coincide con la 
multiplicidad de una raíz. Si o(/, zq) = —n < 0 se dice que zq es un polo de 
orden n de zq- Es claro que f(z) tiende a infinito cuando z tiende a un polo. 

Finalmente, si o(/, zq) = —00 se dice que el punto Zq es una singularidad 
esencial de /. Notemos que / no puede estar acotada en un entorno de una 
singularidad esencial. En efecto, si lo estuviera, también lo estaría la parte 
singular de su serie de Laurent, es decir, tendríamos una función 



convergente para 0 < \z — z 0 \ y acotada en un entorno de z 0 . Entonces la función 
g(l/(z — zo)) está definida por una serie de potencias que converge en C y tiene 
que estar acotada en un entorno de 00, luego está acotada en todo C. Por el 
teorema de Liouville ha de ser constante, luego de hecho ha de ser nula, al igual 
que g, lo que nos da una contradicción. 

Tampoco puede ser que una función / tienda a 00 cuando z tiende a una 
singularidad esencial z 0 , pues entonces 1// tendería a 0, luego z 0 sería una 
singularidad evitable de 1 // (no puede ser un polo ni una singularidad esencial) , 
digamos l/f(z) = (z — z 0 ) n g(z), para una cierta función g holomorfa en un 




Por consiguiente el desarrollo de Laurent de / es 
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entorno de Zo que no se anula en z 0 . Por consiguiente /(z) = (z — z 0 )~ n (l/g(z)), 
donde el segundo factor es una función holomorfa en un entorno de Zq que no 
se anula. Desarrollándola en serie de Taylor vemos que / tiene un polo en z 0 , 
en contra de lo supuesto. 

Como los casos que hemos considerado son todos los posibles y se excluyen 
mutuamente, hemos probado lo siguiente: 

Teorema 12.18 Sea z 0 una singularidad aislada de una función holomorfa f. 
Entonces 

a) zq es una singularidad evitable de f si y sólo si f está acotada en un 
entorno de zq. Además en tal caso existe lím /(z) € C. 

z— >zo 

b) zo es un polo de f si y sólo si lím f(z) = oo. 

Z—>Zo 

c) z 0 es una singularidad esencial de f si y sólo si f no tiene límite (finito 
o infinito) en z 0 . 

Definición 12.19 Si z 0 es una singularidad aislada de una función holomorfa 
/ se llama residuo de / en zo al coeficiente a_i de su serie de Laurent en zq. Lo 
representaremos por Res(/, zq). 

El residuo de / es lo único que influye al calcular una integral a lo largo de 
una circunferencia que rodee a zo y a ninguna otra singularidad de /. En efecto, 
si una función / es holomorfa en Br{zq) \ {z 0 } y 0 < r < R entonces 

z 0 ) n d( 



Más en general, tenemos el siguiente resultado, que extiende al teorema de 
Cauchy. 

Teorema 12.20 (Teorema de los residuos) Sea íl C C un abierto acotado 
tal que fl sea una variedad con frontera en las condiciones del teorema de Sto- 
kes 10.26. Sea f una función holomorfa definida en un abierto que contenga 
a fl salvo a lo sumo un número finito de sus puntos, ninguno de ellos en dQ. 
Entonces 

f /(C)dC = 27r í ^Res(/,z). 

DEMOSTRACIÓN: Para cada punto z £fl donde no esté definida / tomamos 
una bola cerrada de centro z y radio r suficientemente pequeño como para que 
el anillo A(z, 0, r) esté contenido en fl y no contenga ninguna singularidad de / 
(no evitable). 




= 27r¿Res(/, z 0 ). 
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Aplicamos el teorema de Stokes a la variedad formada por 



íi menos las bolas abiertas. El resultado es que la integral de \(^^ C^/ 
f en dfl, es igual a la suma de las integrales de / a lo largo ' K 

de las circunferencias, cuyo valor ya lo hemos calculado y es 
el que requiere el teorema. ■ 

El teorema de los residuos tiene innumerables aplicaciones, especialmente al 
cálculo de integrales y suma de series. Veamos una a modo de ejemplo. 

Teorema 12.21 Consideremos una función racional (cociente de polinomios) 
de modo que gradQ(a;) > gradP(x) + 2 y Q(x) no tenga raices reales. Entonces 



L 



R(x) dx = 2ni Res(i?, z). 

Im z>0 



Demostración: La función R(z) está definida sobre todo el plano complejo 
salvo en las raíces de Q(z), que son un mimero finito. Sea r un número real 
mayor que el módulo de cualquiera de estas raíces. Consideremos el semicírculo 
de centro 0 y radio r contenido en el semiplano superior. Está en las condicio- 
nes del teorema de Stokes, pues su frontera tiene tan sólo dos puntos singulares 
(±r). Al aplicar el teorema de los residuos obtenemos que 



/ R(z)dz = 2ni Res(f?,z). 

J 0n Im Z >0 



La frontera de menos sus dos puntos singulares es la unión de dos varie- 
dades: la semicircunferencia de carta re lt , para t € [0,7r], y el intervalo [— r, r], 
una carta del cual es la identidad. Así pues, 

í R(z)dz= í R(x)dx + irí R(re lt )é l dt. (12.2) 

JdQ J-r JO 

Pongamos que 

a n z n + --- + a lZ + a 0 1 a n + + ■ ■ ■ + + f£ 



R(z) 



El último término tiende a a n /b, n cuando z tiende a oo, luego para valores 
grandes de \z\ se cumple 

\R(z)\<fr conCel. 

I V /l — „ \m-n — \ y 2 ' 



Por consiguiente 

ir í R{re il )e lt dt 
Ja 



nrC nC 

— ^2 r ' 
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luego el último término de (12.2) tiende a 0 cuando r tiende a +oo. Puesto 
que la expresión es constante (es la suma de los residuos de R(z)), también ha 
de existir el límite la integral sobre [— r, r}. Teniendo en cuenta que R(x) sólo 
puede cambiar de signo un número finito de veces, el teorema de la convergencia 
monótona puede aplicarse para justificar que R(x) es integrable en R. Al tomar 
límites en (12.2) se obtiene la igualdad del enunciado. ■ 

Ejemplo Vamos a calcular 



Si llamamos ( = e í7r / 4 , las raíces del denominador son £, £ 3 , £ 5 , £ 7 , de las 
cuales tienen parte imaginaria positiva 



Tenemos que R(z) = (z — Q~ 1 g{z), donde g(() ^ 0, luego £ es un polo 
simple (de orden 1) del integrando R. El argumento que sigue es una técnica 
general para calcular residuos de polos simples. Ha de ser 




c = 



V2 V2 




„, , Res(R, C) 

R(z) = z _ c + h (*), 



para cierta función h holomorfa alrededor de £. Por consiguiente 



(z-QR(z)=Rea(R,Q + (z-Qh(z) 



y así el residuo puede calcularse como 



Res(ñ,C) = lím(z - ()R(z). 



En nuestro caso 



Res(i?, C) = lím 



(z C 3 )(z C 5 )(z C 7 ) (C - C 3 )(C - C 5 )(C 
i _c 5 



C 7 ) 



C 3 (l-¿)(l + l)(l + ¿) 4' 



y del mismo modo llegamos a 



Res (i?, C 3 ) = 



1 



c 7 



(C 3 -C)(C 3 -C 5 )(C 3 -C 7 ) 



4 



Por consiguiente 
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12.3 Funciones subharmónicas 

Recordemos que una función real de una variable es convexa si y sólo si su 
gráfica en un intervalo queda por debajo de la recta que coincide con ella en 
sus extremos. Si sustituimos "recta" por "función harmónica" y generalizamos 
a una dimensión arbitrara obtenemos el concepto de función subharmónica: 

Definición 12.22 Sea Í7 un abierto en IR™. Una función continua / : íl — > IR 
es subharmónica (superharmónica) si para toda bola cerrada B contenida en í¿ 
se cumple que f\s < h {¡\b > h), donde h es la función (continua) harmónica 
en (el interior de) B que coincide con / en dB. 

Es inmediato que una función es harmónica si y sólo si es subharmónica y 
superharmónica al mismo tiempo, así como que una función / es subharmónica 
si y sólo si — / es superharmónica y viceversa. Esto hace que todo teorema 
sobre funciones subharmónicas se traduzca inmediatamente a otro análogo sobre 
funciones superharmónicas. Por lo tanto en lo sucesivo trabajaremos únicamente 
con funciones subharmónicas. 

No exigimos que las funciones subharmónicas sean derivables, pero si son 
al menos de clase C 2 entonces pueden ser caracterizadas en términos de su 
laplaciano: 

Teorema 12.23 Sea f una función real de clase C 2 en un abierto O C K™. 
Entonces f es subharmónica si y sólo si Af > 0. 

DEMOSTRACIÓN: Supongamos que Af > 0 y tomemos una bola cerrada B 
de centro xq contenida en íi. Sea h la función harmónica en B que coincide con 
/ en dB. Hemos de probar que f < h, equivalentemente, que f\s — h <Q. Por 
continuidad y compacidad f\ B — h ha de tomar un valor máximo en la clausura 
de B. Si éste es positivo lo tomará en un punto x\ € B (pues en la frontera / 
coincide con h). Tomando c > 0 suficientemente pequeño, la función 

<j>(x) = c\\x - x 0 \\ 2 + f(x) - h(x) 

cumple 4>(xi) > (j>(x) para todo x £ dB. En efecto, si x € dB se cumple 
4>{x) = cr 2 , luego basta tomar c > 0 de modo que cr 2 < f(xi) — h(xi). 

De nuevo por continuidad y compacidad, <fi tomará su valor máximo en un 
punto de la clausura de B, pero según lo dicho ha de ser en realidad un punto 
interior x 2 G B. La función que resulta de fijar todas las variables de <fi menos 
la ¿-ésima tiene un máximo en (x 2 )i, luego 2 

d 2 é>, . 

a|(* 9 ) < o- 

Sumando las derivadas obtenemos que 

0 > A(j)(x 2 ) = 2nc + Af(x 2 ) - Ah(x 2 ) = 2nc + Af{x 2 ), 



2 Si una función real / de clase C 2 tiene un máximo en un punto x, entonces f'(x) = 0 y 
f"(x) < 0, pues si f"(x) > 0 tendríamos que /' sería positiva a la derecha de x, con lo que / 
sería creciente a la derecha de x y f(x) no podría ser un máximo. 
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luego A/(x 2 ) < — 2nc < 0, en contra de lo supuesto. Por consiguiente el máximo 
de fs — h es menor o igual que 0 y así / es subharmónica. 

Recíprocamente, si / es subharmónica en fl pero A/ < 0 en algún punto, 
por continuidad existirá una bola abierta B en la cual A/ < 0, luego por la 
parte ya probada — / será subharmónica en B, luego / será subharmónica y 
superharmónica en B, luego será harmónica y en realidad cumplirá A/ — 0 en 
B, con lo que tenemos una contradicción. ■ 

La propiedad de ser subharmónica es local. El teorema anterior lo prueba 
para funciones de clase C 2 , pero es cierto en general, como se desprende del 
siguiente resultado: 

Teorema 12.24 Sea f : fl — > R una función subharmónica en un abierto de 
R n . Si io£ÜJ B r (xo) C fl, entonces 



donde o n -\ es I a medida de Lebesgue de la esfera unitaria de dimensión n — 1. 

Recíprocamente, si f es continua y cumple la desigualdad anterior en cada 
punto x 0 para una sucesión de radios r n > 0 convergente a 0, entonces f es 
subharmónica en fl. 



Demostración: Sea h la función harmónica en B r (xo) que coincide con / 
en la frontera. Entonces 



Veamos el recíproco. Sea xq g y sea R > 0 tal que Br(xo) C íi. Sea h la 
función harmónica en la bola que coincide con / en la frontera. Hemos de probar 
que f < h. Sea g = f — hymsu supremo en la bola cerrada. Hemos de ver que 
es menor o igual que 0. Supongamos, por el contrario, que m > 0. Como g es 
nula en la frontera de la bola, el conjunto E = {x g Bjí(xo) | g(x) — m} es un 
subconjunto compacto de Br(xq). Sea x\ g E tal que \\x\ — x 0 || sea máximo. 
De este modo, para todo r suficientemente pequeño, al menos media esfera de 
centro x\ y radio r está fuera de E. Tomando como r uno de los valores para 
los que se cumple la desigualdad del enunciado obtenemos: 



lo que prueba que m = 0, o sea, / < h en la bola. Así pues, / es subharmónica. 





rn 
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Ejemplo Si íl es un abierto en C y f : Cl — > C es una función holomorfa, 
entonces |/| es una función subharmónica. 

En efecto, tomemos una bola B r (zo) C íi. Entonces la fórmula integral de 
Cauchy nos da 

<^-í 1/1(0 dC- 
2nr J K - ZQ \ =r 

Basta aplicar el teorema anterior. ■ 

Veamos otra propiedad importante de las funciones subharmónicas. Para 
el caso particular del módulo de una función holomorfa recibe el nombre de 
Principio del módulo máximo. 

Teorema 12.25 (Principio del máximo) Sea f una función subharmónica 
no constante en un abierto fl C R™. Entonces 

a) Para todo x n G fl se cumple f(xo) < sup/(x). 

xeíi 

b) Si fl está acotado y f es continua en Q, entonces para todo x 0 € fl se 
cumple 

/Oo) < máx/(a;). 

xGoíi 

DEMOSTRACIÓN: Podemos suponer que es conexo. Sea ra — sup/(x) 

xeíi 

(quizá m = +oo). Descomponemos Í7 como unión de los conjuntos 
fíi = {x e Cl | f(x) = m}, íl 2 = {x £íl\ f(x) < m}. 

La continuidad de / implica que O2 es abierto. Si probamos que fíi también 
lo es, por conexión uno de los dos será vacío, pero como / no es constante tendrá 
que serlo fl\ y a) quedará demostrado. Para probar que fli es abierto podemos 
suponer que es no vacío, lo que implica que m es finito. 

Tomemos xq £ Al ser / subharmónica, para r suficientemente pequeño 
se cumple 

0< í f(x)d<j-<j n _ 1 r n - 1 f(x 0 )= í (f(x)-f(x 0 ))da 

J\\x—x 0 \\=r J\\x—x 0 \\=r 

Como f(x) — f(xo) = f(x) — m < 0, la desigualdad anterior es una igualdad, 
y f(x) = m para todo x tal que \\x — a?o || = r , para todo r suficientemente 
pequeño, es decir, hay un entorno de xo contenido en Qi. Esto prueba a). El 
apartado b) es una consecuencia inmediata. ■ 

Como aplicación obtenemos la unicidad de la solución del problema de Di- 
richlet para abiertos con frontera no vacía (no necesariamente acotados): 

Teorema 12.26 Sea fl un abierto en K" distinto de 0 ydeR n . Sea f : Ü — >R 
una función continua harmónica en íl y tal que f = 0 en dfl. Entonces f = 0 
en fl. 



\f\(zo) = 



-í 



IC-zol 



/(O 

=r C — z a 



d( 



12.4. El problema de Dirichlet 



439 



DEMOSTRACIÓN: Basta probar que / es constante en Q, pero si no lo fuera, 
por el teorema anterior debería ser / < 0 en fl (porque / es subharmónica) y 
/ > 0 en fl (porque —/es subharmónica). ■ 

Veamos algunas propiedades adicionales que en la sección siguiente nos ayu- 
darán a probar que el problema de Dirichlet tiene solución en una familia muy 
amplia de abiertos. 

Teorema 12.27 El máximo de dos funciones subharmónicas es una función 
subharmónica. 

DEMOSTRACIÓN: Sean fx y / 2 dos funciones subharmónicas en un abierto 
fl C K™. Sea f(x) = max{fi(x),f2(x)}. Fijada una bola cerrada B contenida 
en Í2, sean h, h\ y hi las funciones harmónicas en en B que coinciden con /, 
fi y Í2 respectivamente en la frontera. Entonces h — h\ > 0 en dB, y al ser 
harmónica la desigualdad vale también en B, es decir, fi<hi<h,e igualmente 
Í2 < h 2 < h, luego f < h. Por consiguiente / es subharmónica. ■ 

Similarmente se prueba: 

Teorema 12.28 La suma de dos funciones subharmónicas es una función sub- 
harmónica. 

Teorema 12.29 Sea fl un abierto enW 1 y B una bola cerrada contenida en fl. 
Sea f una función subharmónica en fl y f la función que coincide con f fuera 
de B y es harmónica en B. Entonces f es subharmónica en fl. 

DEMOSTRACIÓN: Aplicaremos el teorema 12.24. Basta considerar puntos 
x 0 € dB. Notemos que / < /' en fl. Entonces 

/'(so) = f(x 0 ) = l — f f{x) da < l — f f\x) da. 

o n -\r n /|| x _ X0 || =r cr n -ir n J\\ x - Xa \\ =r 



12.4 El problema de Dirichlet 

Recordemos que el problema de Dirichlet para un abierto íi C K" consiste 
en determinar si las funciones continuas en dfl pueden extenderse a funciones 
continuas en íi harmónicas en Í2. El teorema 12.26 prueba que tales extensiones 
son únicas cuando realmente existen (suponiendo <9f2 ^ 0), pero hasta ahora 
sólo hemos probado que el problema tiene solución para las bolas abiertas. 

Sea / : dfl — > K una función continua y acotada. Llamaremos familia 
de Perron de / al conjunto P(f, íl) de todas las funciones u continuas en Í2, 
subharmónicas en fl y tales que u\qq < /. Si M es una cota de /, entonces el 
principio del máximo prueba que toda función u en estas condiciones cumple 
u < M en fl. Por consiguiente podemos definir la función de Perron de / como 

Pf(x) = sup{w(a;) | u € P(f, fl)}, para x G fl. 
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Ahora observamos que si el problema de Dirichlet tiene solución para / y 
Q, entonces la solución ha de ser P¡. En efecto, la solución g está obviamente 
en P(f,fl), luego g < Pf. Por otra parte, si u £ P(f,Q) la función u — g es 
subharmónica y en <9f2 es < 0, luego por el principio del máximo se cumple 
u — g < 0 en fl, o sea, u < g, luego Pf < g. 

Para probar que Pf es realmente solución del problema de Dirichlet hemos 
de ver dos cosas: que es harmónica y que tiende a / en dfl. Lo primero podemos 
probarlo ya: 

Teorema 12.30 Sea fl un abierto en R n tal que dfl ^ 0. Sea f : dfl — > R 

una función continua y acotada. Entonces Pf es harmónica en Q. 

Demostración: Tomemos x 0 £ y sea r > 0 tal que J5 r (x 0 ) C Q. Po- 
demos tomar una sucesión de funciones u n £ P(f,fl) tales que límu„(a;o) = 

n 

Pf(xo). Sustituyendo cada u n por el máximo de todas las anteriores podemos 
suponer que u n es creciente. Más aún, aplicando el teorema 12.29 obtenemos 
funciones v n £ P(f,Q) que son harmónicas en B r (xo). La sucesión v n también 
es creciente y, como u n (xo) < v n (x 0 ) < Pf(x 0 ), la sucesión v n (xo) también 
converge a Pf(x 0 ). 

Veamos que v n converge uniformemente en un entorno de x 0 . Esto probará 
que Pf es harmónica en un entorno de x$. Sea 0 < r' < r. Sea \\y — xo\\ = r y 
\\x — x 0 \\ = r'. Entonces r — r' < \\y — x\\, luego 



|| 2/ - x\\ n ~ (r- r')"' 
y el teorema 12.3 implica que 



r 2 _ r ,2 1 r 

v n +i(x) - v n (x) < — / (v n+1 - v n ) da, 

{r-r') n ra n -i J\\ y - Xo \\= r 



luego el teorema del valor medio nos da 



r 2 _ , 

v n+1 (x) - v n (x) < ^ r _ r ,^ n r ™ 2 (v n +i(xo) - v n (x 0 )). 

Fijado 0 < k < r, para todo x £ B k (x 0 ) se cumple r' < k, luego 

^ ^ ti— ? r -\- r ™—9^ r -\- k n_9 ^ r 
r = r r < r r = M, 



(r-r') n (r-r')" -1 _ (r - k) n ^ x 

con lo que v n +i(x) — v n (x) < M(v n+ i(x 0 ) — v n (x 0 )). Puesto que 

oo 

M x o) + ^2(Vn+l(xo) - V n (x 0 )) = Pf(x 0 ), 
n=0 

el criterio de mayoración de Weierstrass implica que la serie 

oo 

M x ) + ^2( v n+l(x) - V n (x)) 
n=0 
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converge uniformemente en B k (x 0 ), pero dicha serie no es sino la sucesión v n . 

m 

En general no es cierto que P¡ coincida con / en dfl. Por ejemplo, tomemos 
fl = Bi(0) \ {(0, 0)} Cl 2 y sea / la función que vale 0 en dB^O) y /(O) = 1. 

Tomemos u £ P(f,fl). Por el principio del máximo se cumple que \\u\\ < 1. 
Dado 0 < e < 1, la función h e (x) = (log||x||)/loge es harmónica en el anillo 
comprendido entre las circunferencias de centro 0 y radios e y 1 (teorema 12.2). 
Además h e vale 0 sobre la circunferencia exterior y 1 sobre la interior. En 
consecuencia u < h f en la frontera del anillo. Como u — h e es subharmónica, de 
hecho u < h e en todo el anillo (por el principio del máximo), es decir, 

u( X )< l0gM 



loge 



para 0 < e < ||x|| < 1. Si fijamos x y hacemos tender e a 0 queda u(x) < 0 para 
todo x € Bi (0) \ {0} y toda u € P(f,fl). Por consiguiente Pf = 0 y no converge 
a / en 0. No existe ninguna función harmónica en fl continua en -Bi(O) que 
tome el valor 0 para ||x|| — 1 y el valor 1 en x = 0. ■ 

Veamos una condición necesaria para que las funciones continuas y acotadas 
en la frontera de un abierto fl se extiendan a funciones harmónicas en fl. Cuando 
fí tiene esta propiedad (entendiendo que díl ^ 0) se dice que es una región de 
Dirichlet. Dado un punto a € dCl, podemos considerar la función 

./V) 



1+ ||a;-a||' 



Claramente se trata de una función continua y acotada en R™ (toma valores 
en [0, 1]) y que se anula únicamente en a. Si fl es una región de Dirichlet existe 
una función continua h : Í7 — > M harmónica en Í7 y que coincide con / en dft. 
En particular h(a) = 0 y h(x) > 0 para todo x € dfl, x ^ a. Vamos a probar 
que una condición más débil que ésta es también suficiente para que fl sea una 
región de Dirichlet. 

Definición 12.31 Sea Í2 un abierto en IR™ distinto de 0 y de IR". Para cada 
e > 0 y a € dfl sea Q e (a) = fin B e (a). Una barrera para fl en a es una función 
continua u : fl e (a) — > IR subharmónica en fir\B € (a) tal que u(a) — 0 y u(x) < 0 
para todo x £ dfl e (a), x ^ a. 

Es claro que si fl es una región de Dirichlet entonces tiene una barrera en 
cada punto de su frontera (para cualquier e > 0, restringimos a fl e (a) la función 
—h que hemos construido en el párrafo anterior). 

Las regiones de Dirichlet admiten la caracterización siguiente: 

Teorema 12.32 Un abierto fl C IR™ de frontera no vacía es una región de 
Dirichlet si y sólo si tiene una barrera en cada punto de su frontera. 
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Demostración: Ya hemos visto que la condición es necesaria. Veamos que 
también es suficiente. Para ello consideremos una función continua y acotada 
/ : dfl — > IR. Basta probar que P¡ es continua en fl y que coincide con / en 
dfl. Fijemos un punto a G dfl y sea v : fl e (a) — > IR una barrera para fl en a. 

Por el principio del máximo v < 0 en íí e (a). Tomando 0 < r < e tenemos 
que v < 0 en el compacto íí e (a) \ B r (a), luego existe un 77 > 0 tal que v < — r¡ 
en dicho compacto. 

Sea w : fl € (a) — > IR el máximo entre — ry y Entonces tu es también una 
barrera para fl en a con la propiedad adicional de que vale —r¡ fuera de B r (a), 
luego se puede extender de forma constante a w : fl — > IR y sigue cumpliendo las 
propiedades de una barrera (salvo que su dominio es mayor). Concretamente, 
w es continua en fl, subharmónica en fl, w(x) < 0 para todo x G dfl, x ^ a y 
w{á) = 0. 

Sean K, e constantes positivas y consideremos la función 
u(x) = f(a) — e + Kw(x). 

Claramente u es continua en íi y subharmónica en íi. Además u(x) < f(a)—e 
para todo x G <9f2 y u(a) = f(a) — e. Como / es continua en a, existe un 
S > 0 tal que f(x) > f(a) — e para los x G dfl que cumplen \\x — a\\ < S. 
Así pues, u(x) < f(x), para estos puntos x. Como w tiene una cota superior 
negativa en el conjunto de puntos x G díl tales que \\x — a\\ > S, eligiendo 
K adecuadamente podemos exigir que u(x) < f(x) para todo x G dCl. Por 
consiguiente u G P(f, fl), luego u < P¡. 

Por consiguiente f(a) — e = u(a) < Pf(a), para todo e > 0, lo que prueba 
que Pf(a) = f(a). No obstante esto no prueba la continuidad de Pj en a. 
Puesto que lím u{x) = f(a) — e, en realidad hemos visto que para puntos x G Ct 

x — >a 

suficientemente próximos a a se cumple /(a) — 2e < Pf{x). 

Aplicamos este hecho a la función P-f, es decir, sabemos que para puntos 
x G Cl suficientemente próximos a a se cumple —/(a) — 2e < P_j(x). 

Ahora bien, si v\ G P(f,íí) y «2 G P(— /, íí) entonces v\ + v-i < 0 en ¿?íl 
y es subharmónica en fl, luego V\ + v 2 < 0 en fl, luego v 2 < —V\ y tomando 
el supremo P_/ < —Vi, luego V\ < —P-f, luego tomando de nuevo el supremo 
Pf < —P-f - Cambiando / por — / obtenemos también la otra desigualdad, es 
decir, 

/(a) - 2e < P f (x) < -P-f(x) < f(a) + 2e, 
para puntos x G fl suficientemente próximos a a, es decir, existe 

lím P f (x) = f(a). 

m 

Terminamos observando que la existencia de barreras es una condición que 
se cumple en una gran clase de abiertos. Por ejemplo, si fl tiene un hiperplano 
tangente en un punto a G dfl, es decir, si todos los puntos de fl están en un 
mismo lado del hiperplano excepto el propio a, que está en el mismo, podemos 
tomar como barrera una aplicación afín que se anule en el hiperplano. 
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Más en general, si existe una bola cerrada B tal que Bílíl = {a} entonces fí 
tiene una barrera en a. Basta considerar una función de la forma A/||ar — c|| + B, 
donde c es el centro de B. 



Capítulo XIII 



Aplicaciones al 
electromagnetismo 

La electricidad y el magnetismo son conocidos desde la antigüedad, si bien 
no han sido comprendidos satisfactoriamente hasta hace relativamente poco 
tiempo, en la culminación de una investigación que comenzó en el siglo XVIII 
con el trabajo de Coulomb y terminó con el descubrimiento de la teoría de 
la relatividad. En la teoría electromagnética clásica (prerrelativista) se aplican 
muchos de los resultados que hemos obtenido en los últimos capítulos, por lo que 
constituye un complemento idóneo a los mismos. Toda la teoría puede deducirse 
a partir de las llamadas ecuaciones de Maxwell, pero en lugar de introducirlas 
directamente dedicaremos las dos primeras secciones a presentar los conceptos 
que involucran en un orden más cercano al proceso histórico que condujo hasta 
ellas. 

13.1 Electrostática 

Con su balanza de torsión, Coulomb estableció en 1785 la ley fundamental de 
la electrostática, que lleva su nombre: las fuerzas eléctricas aparecen en relación 
con una magnitud de la materia llamada carga eléctrica. Existen dos clases de 
carga eléctrica, que arbitrariamente podemos llamar positiva y negativa. Dos 
partículas con carga eléctrica experimentan una fuerza proporcional al producto 
de sus cargas e inversamente proporcional al cuadrado de la distancia que las 
separa. La fuerza es atractiva si las cargas tienen signos opuestos, y es repulsiva 
si los signos son iguales. 

Observamos que la ley de Coulomb es muy similar a la ley de la gravitación 
de Newton, salvo por el hecho de que la fuerza gravitatoria es siempre atractiva. 
Existe otra diferencia importante: la masa de un cuerpo puede definirse sin 
hacer referencia a la gravitación, como la proporción entre la fuerza que se le 
aplica y la aceleración que experimenta. El hecho de que esta magnitud de masa 
inerte coincida con la masa gravitatoria que aparece en la ley de Newton no es 
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algo obvio en absoluto, sino una propiedad importante de la gravitación. En 
particular, la constante gravitatoria G que aparece en la ley de Newton es una 
constante física que ha de ser medida para ajustar la fórmula. Por el contrario, la 
carga eléctrica sólo se manifiesta en la medida en que los cuerpos experimentan 
fuerzas eléctricas, por lo que no tenemos predefinida una unidad de carga. Así 
pues, podríamos definir la unidad de carga eléctrica como la que hace que dos 
cargas unitarias separadas por una distancia de 1 metro experimenten una fuerza 
de 1 Newton, y en tal caso la constante que requiere la ley de Coulomb tomaría 
el valor 1. Por razones de tradición, la unidad de carga eléctrica, llamada 
culombio, se define como la que hace que dos cargas unitarias separadas por 
una distancia de un metro experimenten una fuerza de 9 • 10 9 Newtons. 
Además es costumbre llamar 

1 

eo = 



36tt10 9 ' 



con lo que la constante que requiere la ley de Coulomb 1 tiene la forma l/47reo. 

Ahora ya podemos enunciar matemáticamente la ley de Coulomb en su forma 
habitual: Si dos partículas puntuales de cargas q y Q están situadas en las 
posiciones x e y respectivamente, entonces, la fuerza eléctrica que Q ejerce 
sobre q es 

p — — 9S_ ( x _ y) 

47reo Ik-yll 3 ^ V) - 

Si comparamos la fórmula anterior con la ley de Newton veremos que falta 
un signo negativo. La razón es que dos masas del mismo signo (o sea, dos masas 
cualesquiera) se atraen, mientras que las cargas del mismo signo se repelen. Esto 
hace que todas las fórmulas subsiguientes difieran en un signo de sus análogas 
gravitatorias. 

En este punto conviene hacer algunas observaciones sobre la forma en que las 
cargas eléctricas aparecen en la naturaleza. La materia ordinaria está compuesta 
por átomos, cada uno de los cuales consta de un núcleo cargado positivamente 
y una corteza de electrones cargados negativamente (los signos se estipulan por 
convenio), de modo que la carga total del átomo es nula. Los electrones tienen 
cierta facilidad de pasar de unos átomos a otros, de modo que en ocasiones 
podemos encontrarnos con átomos con un exceso o defecto de electrones (iones), 
pero incluso entonces los iones se encuentran mezclados (aleatoriamente en el 
caso de sales disueltas o según patrones geométricos en el caso de las estructuras 
cristalinas), de modo que en cualquier volumen macroscópico de materia la carga 
total es nula. 

En principio, la ley de Coulomb, tal y como la hemos establecido, es válida 
para dos cargas puntuales separadas por un espacio vacío. Si las tenemos se- 
paradas por un medio material la presencia de cargas eléctricas hace que la ley 
de Coulomb no sea aplicable tal cual. Además es imposible tener en cuenta 



Actualmente el culombio se define de otra forma más fácil de medir, con lo que este valor 
resulta ser aproximado. 
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cada una de las innumerables cargas eléctricas del medio para estudiar sus efec- 
tos. Afortunadamente, cuando las cargas del medio están distribuidas de forma 
homogénea, sin ninguna estructura destacada, como ocurre en un fluido (aire, 
agua, etc.) o el seno de un metal — y éstos son los casos de mayor interés — 
su efecto consiste únicamente en una atenuación de las fuerzas eléctricas, de 
modo que la ley de Coulomb sigue siendo válida sin más que sustituir la cons- 
tante eo por otra constante e dependiente del medio. Concretamente se suele 
escribir e = e r e 0 , donde e recibe el nombre de permisividad del medio, e r es la 
permisividad relativa del mismo y, naturalmente, e 0 es la permisividad del vacío. 

En el seno de estructuras materiales más complejas, como las sustancias 
cristalinas, las distorsiones de la ley de Coulomb son más drásticas, pues la 
distribución geométrica de los iones hace que pequeños campos eléctricos locales 
se acumulen hasta hacerse notables a nivel macroscópico. Este fenómeno se 
conoce como polarización eléctrica del medio. Comentaremos algo más sobre 
los efectos de la polarización, pero antes conviene introducir algunos conceptos 
adicionales. 

En lugar de la fuerza que se ejercen dos partículas conviene hablar del campo 
eléctrico generado por una partícula: la intensidad del campo eléctrico en un 
punto del espacio es la fuerza que experimentaría una partícula con 1 culombio 
de carga (positiva) que estuviera situada en dicho punto. Si la carga Q que 
genera el campo está situada en la posición y, entonces el campo eléctrico en el 
punto x es 

El vector de inducción eléctrica generada por una carga Q se define como 

D{x) = hwh\\¿ x - y) - 

De este modo, salvo por la constante e 0 , el vector D nos da el campo eléctrico 
que induce la carga Q sin tener en cuenta la acción del medio. Si el medio es 
homogéneo tenemos la relación E = D/e. En el seno de un elemento cristalino, 
donde la polarización se debe a una estructura geométrica simple, las propieda- 
des del vector D siguen siendo válidas (pues hacen referencia a lo que ocurriría 
en el vacío) y el único cambio es que el campo eléctrico total es de la forma 
E = D/e + P, donde P es un vector de polarización que depende de la es- 
tructura del cristal. En medios más irregulares la relación entre la inducción 
D y el campo real E que aparece a causa de la influencia del medio puede ser 
mucho más compleja. En lo que sigue nos limitaremos a considerar el caso en 
que E = D/e. 

Puesto que la fuerza total que actúa sobre una partícula es la suma vectorial 
de las fuerzas que actúan sobre la misma, el campo eléctrico generado por un 
número finito de partículas es la suma de los campos que genera cada una de 
ellas. Como en el caso de la gravitación, podemos generalizar la ley de Coulomb 
para determinar el campo eléctrico determinado por una distribución continua 
de cargas en el espacio. Llamemos p a la densidad de carga, es decir, la función 
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cuya integral en una región da la carga contenida en la misma. Entonces el 
campo eléctrico en un punto x viene dado por 



Equivalentemente, la inducción eléctrica de la distribución de carga p es 



El teorema 10.19 garantiza que E(x) y D(x) están bien definidos. Más aún, 
el campo eléctrico es conservativo y deriva del potencial 



es decir, E = — VV. La interpretación física de V es que el trabajo necesario 
para transportar una carga Q entre dos puntos es igual a Q por la diferencia 
de potencial entre los mismos. Si medimos este trabajo en Julios y la carga Q 
en culombios, la unidad de potencial — es decir, el Julio/culombio — recibe el 
nombre de voltio. 

El potencial verifica la ecuación de Poisson: AV = —p/e, o equivalente- 
mente, div E = p/e. En términos de la inducción eléctrica queda una relación 
más simple: divD = p. El teorema de la divergencia nos da el teorema de 
Gauss: 

El flujo de la inducción eléctrica D a través de una superficie cerrada 
es igual a la carga neta que ésta encierra. 

El hecho de que E y D sean campos conservativos nos da también la relación 
rot£> = rot.E = 0. 

Ahora debemos resaltar una restricción importantísma, y es que todo lo 
anterior sólo es aplicable al caso en que la distribución de la carga eléctrica no 
varía con el tiempo. 2 Antes de entrar en el caso general debemos detenernos en 
el estudio de la magnetostática. 



La manifestación más conocida de la fuerza magnética la constituyen los 
imanes. Se trata de ciertos cuerpos que atraen al hierro y a otros metales. Hay 
imanes naturales como la magnetita, y también se puede convertir en un imán 
(durante un tiempo prolongado) a una pieza de hierro, sin más que frotarla 
con otro imán. Un imán, cualquiera que sea su forma, presenta siempre dos 

2 No es necesario tomar esto al pie de la letra. Por ejemplo, si una carga eléctrica pequeña 
se mueve en el seno de un campo eléctrico potente, su movimiento afecta tan poco al entorno 
que las leyes electrostáticas son aplicables. 
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polos, a los que se les llama Norte y Sur. El nombre no es aleatorio, sino que 
se debe a que la Tierra tiene propiedades magnéticas, de modo que una aguja 
imantada (suspendida de modo que pueda girar libremente) orienta sus polos 
en la dirección Norte-Sur. Los polos homólogos de dos imanes se repelen, los 
polos opuestos se atraen. En un principio se pensó en la existencia de "cargas 
magnéticas" similares a las eléctricas y que explicaran el magnetismo, pero 
existen fenómenos que no encajan en ese esquema. Por ejemplo, si se rompe 
una barra imantada, los dos trozos no resultan ser un polo norte y un polo sur 
aislados, sino que cada parte pasa a tener su propio polo norte y su propio polo 
sur. 

La realidad es que las fuerzas magnéticas las provoca el movimiento de las 
cargas eléctricas, y a su vez afecta a las cargas eléctricas en movimiento. La 
atracción del hierro y los imanes se debe al movimiento microscópico de los elec- 
trones en los átomos. Cuantitativamente, la fuerza magnética puede describirse 
mediante un campo vectorial B, de modo que la fuerza magnética que actúa 
sobre una partícula con carga q que se mueve con velocidad v viene dada por la 
ley de Laplace: 

F = qv A B. 

Así pues, la fuerza magnética es nula sobre partículas sin carga eléctrica o 
sobre cargas en reposo. Teniendo en cuenta además el campo eléctrico, la fuerza 
total que actúa sobre una partícula cargada es 

F = q(E + vAB). 

Del mismo modo, los campos magnéticos los producen las cargas eléctricas en 
movimiento. Al igual que la ley de Coulomb que determina el campo eléctrico 
a partir de la densidad de carga sólo es válida cuando ésta es constante, el 
campo magnético está determinado por la llamada ley de Biot y Savart bajo el 
supuesto de que tanto la densidad de carga como la densidad de corriente sean 
constantes. 

Para introducir el concepto de densidad de corriente necesitamos descompo- 
ner la densidad de carga como p = p + — p_ , donde p+ es la densidad de carga 
positiva y p_ es la densidad de carga negativa. Similarmente, llamamos v + al 
campo de velocidades de las cargas positivas y v_ al campo de velocidades de 
las cargas negativas. Así, la densidad de corriente se define como 

«*= P+ v + - p-v-. 

Según razonamos al hablar de fluidos, la interpretación de ?es que su flujo 
a través de una superficie es la cantidad de carga eléctrica neta (positiva menos 
negativa) que la atraviesa por unidad de tiempo. En particular, z*se mide en 
culombios por segundo y metro cuadrado. La unidad culombio/segundo recibe 
el nombre de amperio, luego la densidad de corriente i*se mide en amperios por 
metro cuadrado. El flujo de ?se mide en amperios. 

La conservación de la carga eléctrica positiva y negativa (respectivamente) 
viene expresada por el equivalente de la ecuación de continuidad en la mecánica 
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de fluidos, que en nuestro caso es 

div p + v + + = 0, div p_v_ + ^ = 0, 

y restando ambas ecuaciones tenemos la ecuación que expresa la conservación 
de la carga eléctrica: 

divi+ -¿=0. 
ot 

La magnetostática estudia el campo magnético bajo la hipótesis de que p y 
Tson constantes, en cuyo caso la ecuación anterior se reduce a 

divi*= 0. 

En este contexto, la ley de Biot y Savart afirma que el campo magnético 
viene dado por 

B( X ) = ^ f ^], A{X - y) dm(y), 
4tt J n \\x-y\\ á 

donde fl es un abierto que contenga a todas las cargas y p es una constante 
llamada permeabilidad magnética. La situación es la misma que en la elec- 
trostática: la constante p depende del medio. La permeabilidad del vacío se 
representa por po y la ley de Biot y Savart vale también cuando las partículas 
están inmersas en un medio homogéneo sin más que cambiar p 0 por otra cons- 
tante p — p r po, para una cierta permeabilidad relativa p r dependiente del medio. 
La permeabilidad en el vacío vale po = 4n ■ 10~ 7 en las unidades usuales. 3 

Teniendo en cuenta que 

jdm = p+v + dm — p_v_dm = v + dq — v_dq, 

la ley de Biot y Savart afirma la contribución al campo magnético en un punto 
x de una partícula con carga dq que se mueve con velocidad v en el punto y 
es perpendicular a v y a x — y, directamente proporcional al seno del ángulo 
entre estos dos vectores y a su carga eléctrica, e inversamente proporcional al 
cuadrado de la distancia. No obstante esto no es cierto para una partícula pun- 
tual aislada, pues una partícula puntual en movimiento produce una densidad 
de carga variable, y nos salimos entonces del contexto de la magnetostática. 

Conviene introducir la inducción magnética 

l_ f i{y) A{x- y) 
4irJ n \\x-y\\ 



De este modo, H determina el campo magnético que se generaría en ausen- 
cia del medio. En medios homogéneos tenemos la relación B = pH. Vamos a 



3 Es decir, tomando el Kilogramo, el metro, el segundo y el culombio como unidades de 
masa, longitud, tiempo y carga eléctrica. La arbitrariedad en la definición del culombio 
permite prefijar el valor de una de las constantes fio o eq. La otra debe medirse. La definición 
actual de culombio hace que fig sea exacta y eo aproximada. 
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justificar que esta integral (o, equivalentemente, la que define a B) existe siem- 
pre, bajo el supuesto de que íes una función de clase C 2 y acotada en fl. Unas 
simples comprobaciones nos dan que 

% ?, A( V } = a i{y) = «*, A. 

\\ x ~ y\\ \\ x ~ y\\ \\ x ~ y\\ 

Por consiguiente 

H(x) = rot / „ ^ „ dm(y). 
1 j 4tt y n ||x - j/ll w 

Las componentes de la última integral son potenciales newtonianos, luego la 
integral existe y la que define a H también. Definimos el potencial vectorial del 
campo magnético como 



A(x) = í lí ^É- ¡¡ dm(y), 
1 1 4nJ n x-y yyh 



^ Jíi \\ x -y\\ 

con lo que B = rot A, lo que a su vez implica div B = 0. Por otra parte, el 
teorema 10.19 nos da la relación AA = —fxt. 

Vamos a calcular el rotacional de H. Por la definición del laplaciano vectorial 
tenemos que 

H rot H = rot rot A = V div A - A A = V div A + fu. 
Calculemos 

= ~h L Áv)Vv ¥^ñ dm{y) 



4tt J n \\x - y\\ Ky> 4tt J a v \\x-y\\ 



dm(y) 



La primera integral es nula porque div y í*=0y, tomando fl suficientemente 
grande como para que f sea nulo en dfl, el teorema de la divertencia implica 
que la segunda también lo es. Concluimos que div A = 0 y, por consiguiente, 

rot H = i. 

En total tenemos las ecuaciones 

div D = p rot E = 0 
div B = 0 rot H = í 

La última ecuación implica que el flujo de corriente a través de una superficie 
es igual a la circulación de H alrededor de su frontera. 
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Terminamos la sección explicando brevemente la relación entre la teoría que 
acabamos de describir y los fenómenos magnéticos cotidianos (imanes, brújulas, 
etc.) 

Ante todo, la Tierra se halla rodeada de un campo 
magnético cuyas causas no se comprenden completamente 
y dependen de la estructura de su núcleo. Las "líneas de 
fuerza" del campo magnético, es decir, sus curvas inte- 
grales, parten del polo sur, donde B es prácticamente 
vertical, se doblan rápidamente y ascienden hacia el polo 
norte, donde penetran de nuevo en la tierra (de hecho las 
líneas de fuerza son cerradas, de modo que descienden 
por el interior de la Tierra hasta volver al punto de partida). En un punto de 
la superficie no muy cercano a los polos el campo magnético terrestre puede 
considerarse constante y apunta en la dirección sur-norte. 

Consideremos un circuito eléctrico circular suspendido vertical- 
mente de modo que pueda girar sobre un eje vertical. Llamemos 
cara Norte del circuito a la cara que muestra la figura, de modo que 
la corriente se ve circular en sentido antihorario. La cara opuesta 
será la cara Sur. Es fácil ver que el campo magnético terrestre hará 
girar el circuito hasta que su cara norte quede encarada hacia el 
polo norte terrestre. En tal caso la fuerza magnética en cada punto del circuito 
apunta hacia fuera del mismo, luego no mueve la espira. 

Teóricamente también podría alcanzarse el equilibrio con 
la cara sur apuntando al norte, pero sería un equilibrio ines- 
table, pues la más leve perturbación haría girar el circuito 
hasta que la cara norte apuntara al norte. F 

El mismo principio explica por qué se orientan las agujas imantadas. La 
imantación de la materia se debe a su estructura atómica. Un modelo simplista, 
pero que basta a nuestros propósitos, consiste en imaginar un imán como una 
porción de materia cuyos electrones giran todos en el mismo plano en el mismo 
sentido, de modo que su polo norte es la superficie mirándolo desde la cual el 
sentido de giro es antihorario. Entonces el argumento anterior se aplica a cada 
átomo del imán. Las fuerzas internas entre átomos contiguos se cancelan, pero 
no así las fuerzas en la superficie del imán, luego el resultado es que el campo 
magnético orienta al imán. Puede probarse que el campo magnético que genera 
un imán es similar al terrestre, pero las líneas de fuerza surgen del polo norte y 
vuelven a entrar en el imán por el polo sur (la Tierra es, pues, un imán con su 
polo norte en el polo sur geográfico y su polo sur en el polo norte geográfico) . 



Es claro que dos polos iguales de dos imanes se repelen y 
dos polos opuestos se atraen. En efecto, las líneas de fuerza que 
salen del polo norte de un imán se abren como las hojas de una 
palmera. Si identificamos cada átomo del otro polo norte con un 
circuito circular el resultado es una fuerza repulsiva. Si los polos 
son opuestos la fuerza resulta atractiva. La intensidad de la 
fuerza magnética depende del flujo de B a través de los polos del 
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imán. Argumentos similares explican que una brújula (horizontal) se desvía en 
presencia de una corriente eléctrica vertical. Es fácil ver que las líneas de fuerza 
del campo magnético de una corriente rectilínea son circunferencias alrededor 
del cable. La brújula se orienta según la dirección de B. Los imanes atraen 
al hierro y otros metales porque los átomos de hierro se orientan con facilidad 
según el campo magnético del imán, con lo que se convierten momentáneamente 
en imanes. 

13.3 Las ecuaciones de Maxwell 

En las secciones anteriores hemos descrito algunas de las leyes de la elec- 
tricidad y el magnetismo, pero también hemos comentado que su validez está 
limitada a ciertas situaciones especiales. Fue J.C. Maxwell el primero que esta- 
bleció (en 1863) las ecuaciones que caracterizan los campos eléctrico y magnético 
en condiciones generales, a partir de las cuales se deducen todas las leyes del 
electromagnetismo. Los hechos que hemos comentado en la sección anterior 
muestran que los campos eléctrico y magnético no son entidades independien- 
tes, sino que están muy relacionados, por lo que a menudo se habla del "campo 
electromagnético". El punto más delicado es establecer con exactitud la depen- 
dencia entre ambos. Así, la ecuación magnetostática rotií = ise generaliza a 
la ecuación 

rr - dD 

rotií = í+ _ 

que muestra cómo la variación del campo eléctrico produce un campo magnético. 
Del mismo modo, sucede que la ecuación electrostática rot E = 0 es incompleta, 
y en el caso general debe modificarse para reflejar que las variaciones de campos 
magnéticos también pueden producir campos eléctricos. Este fenómeno fue 
descubierto por Faraday investigando con bobinas, es decir, circuitos en forma 
espiral. En la sección anterior hemos visto que un campo magnético puede hacer 
girar un circuito en forma de espira. Recíprocamente, Faraday descubrió que si 
hacemos girar un circuito en forma de espira en el seno de un campo magnético, 
éste inducirá una corriente en el circuito. Debidamente generalizada, la ley de 
Faraday puede enunciarse como sigue: 

Si C es un circuito que rodea una superficie S, entonces la circu- 
lación de E a lo largo de C coincide con el opuesto de la variación 
del flujo de B a través de S. 

Simbólicamente : 

S c Eif =-lís mB) - 

El signo expresa una simple cuestión de orientación: fijado el sentido en 
que el flujo se considera positivo, un aumento del mismo induce sobre C una 
corriente en sentido horario. Esta ley explica el funcionamiento de los alternado- 
res: cuando un circuito en forma de espira es hecho girar en un campo magnético 
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constante, el flujo que lo atraviesa pasa de un valor máximo F hasta el valor 
— F de forma periódica, lo que provoca una corriente alterna en el circuito. 
Por el teorema de Stokes tenemos 



/ d$(rot£) = í d$ 
Js Js 



dB 

'~dt 



y como la igualdad se ha de dar para toda superficie S es claro que ha de ser 

dB 

Con esto tenemos la última de las ecuaciones de Maxwell. En total son las 
siguientes: 

div D = p div B = 0 

dB , dD 

rot¿;=-— rotií = z+— . 

dt dt 

La elección de D o E y de B o H no se debe a razones estéticas (para 
eliminar constantes), sino que de este modo las ecuaciones valen para medios 
arbitrarios. En medios homogéneos debemos completarlas con las relaciones 

D = eE, B= pH. 

Ninguno de los argumentos de las secciones anteriores puede considerarse una 
demostración de las ecuaciones de Maxwell, pues todos ellos partían de hipótesis 
restrictivas sobre invarianza en el tiempo. La teoría del electromagnetismo de 
Maxwell postula la validez general de estas cuatro ecuaciones y deduce de ellas 
todas las propiedades del electromagnetismo, incluidos los resultados de las 
secciones anteriores. Por ejemplo, tomando la divergencia en la cuarta ecuación 
queda 

- d 

0 = div rot H — div i + — div D, 
at 

y usando la primera ecuación llegamos a 

. dp 
dlVi= -^' 

es decir, tenemos la ecuación de continuidad, que expresa la conservación de la 
carga eléctrica. Por otra parte, el teorema de Gauss se sigue inmediatamente 
de la primera ecuación mediante el teorema de la divergencia. 

Los potenciales De div B = 0 se sigue la existencia del potencial vectorial 
magnético A, de modo que B = rot A. La tercera ecuación de Maxwell mues- 
tra que en general el campo eléctrico no es conservativo, pero sustituyendo el 
potencial magnético queda 

dA s 

vot i E+— ) =0. 



13.3. Las ecuaciones de Maxwell 



455 



con lo que existe un potencial escalar V tal que 

3 A 

E=-W- w (13.1) 

En el caso en que A no dependa de t tenemos el potencial electrostático que 
ya conocemos. Las ecuaciones de Maxwell permiten expresar los potenciales 
V y A en términos de la distribución de carga p y la densidad de corriente i. 
El primer paso es encontrar ecuaciones diferenciales que contengan una sola de 
las incógnitas V y A. Para ello sustituimos la ecuación anterior en la primera 
ecuación de Maxwell: 

-AV - —divA= (13.2) 
ot e 

Por otro lado, sustituyendo (13.1) y B = rot A en la cuarta ecuación de 
Maxwell resulta 

/ „dV d 2 A 
rot rot A = pi + pe [ — V— 



dt dt 2 

Ahora usamos la definición de laplaciano vectorial: 

dV d 2 A 

V div A — AA = tu — ueV^¡ pc^nr (13.3) 

ot ot ¿ 

Las ecuaciones (13.2) y (13.3) se pueden simplificar notablemente si tenemos 
en cuenta que A está determinado únicamente por su rotacional, y el teorema 
11.21 nos permite elegir su divergencia. Una buena elección es 

dV 

div A = -fie— . (13.4) 

Esta ecuación se conoce como condición de Lorentz y tiene una interpretación 
en la teoría de la relatividad. Sustituyéndola en las ecuaciones que hemos ob- 
tenido resultan dos fórmulas simétricas: 

d 2 V p 
AV-fie^ = -t (13 .5) 

d 2 A 

AA-fie-^ = -fií (13.6) 

Estas ecuaciones determinan los potenciales V y A a partir de p e i, y a su 
vez los potenciales determinan los campos E y B a través de las ecuaciones 

8 A 

5 = rot A, E=-VV - —. 

Ot 

Los campos E y B satisfacen ecuaciones similares a (13.5) y (13.6). Para 
obtener la de E tomamos gradientes en la primera ecuación de Maxwell y apli- 
camos la definición del laplaciano vectorial: 

A£ + rot rot £ = -V p. 

e 
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Aplicamos la tercera ecuación y después la cuarta: 

Q 1 

AE - — rotB = -Vp, 



dt 



e 



De aquí llegamos a 



.'di d 2 D\ 1 



A £ - íl£ ^f^^ + 4 r (13.7) 



Un razonamiento similar nos da 

d 2 H 

AH - pe— = - rot i. (13.8) 

Las ecuaciones en derivadas parciales (13.5), (13.6), (13.7) y (13.8) se diferen- 
cian únicamente en el término independiente (el que no contiene a la incógnita 
V, A, E o H). Ello hace que su resolución pueda ser estudiada en general, cosa 
que hacemos en la sección siguiente. Notemos, no obstante, que si las magnitu- 
des son invariantes con el tiempo todas ellas son ecuaciones de Poisson, que ya 
sabemos resolver, y nos llevan a los resultados de las secciones anteriores. 

Energía electromagnética Apliquemos la relación (10.11) a los campos E 
y H, es decir: 

div(¿; A H) = (rot E)H - £(rot H). 
Si lo aplicamos a los campos E y H, las ecuaciones de Maxwell implican 

div(EAH) = —H — E — ET= - ET. 

x ' dt dt dt 2 dt 2 

Fijado un volumen í¿, podemos aplicar el teorema de la divergencia: 



|- f (^-+ € *¡Adm+ í Eídm=- í d$(E A H) (13.9) 
dt Jn\ 2 2 ) J n J dn 



Observemos que si sobre un objeto de masa m que se mueve con velocidad 
v actúa una fuerza F, su energía cinética es (l/2)mv 2 , luego la variación de 
esta energía es mva = vF. En nuestro caso, si llamamos v a la velocidad de 
las cargas en cada punto (y recordando que dra es el elemento de volumen), se 
cumple Eidra — Epv dm = Ev dq = (E + v A B)v dq = vdF, luego el segundo 
término del primer miembro de la igualdad anterior es el aumento de energía 
cinética del fluido eléctrico producido por el campo electromagnético. 

Esto nos lleva a definir la energía potencial electromagnética acumulada en 
un volumen íi como 

'pH 2 eE 2 - 



+ -y I dm 
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De este modo, la relación anterior es una ley de conservación: si tomamos 
fl suficientemente grande como para que los campos sean nulos en su frontera, 
tenemos que la energía total (cinética más potencial) permanece constante. Más 
en general, el vector P = E A H recibe el nombre de vector de Poynting, y su 
flujo a través de una superficie nos da la energía electromagnética que sale de 
ella por unidad de tiempo. La variación de la energía (o el trabajo realizado 
por unidad de tiempo) se mide en vatios. Un vatio es simplemente un Julio 
por segundo. Las unidades del vector de Poynting son, pues, vatios por metro 
cuadrado. 

La ley de Ohm Una de las aplicaciones más importantes del electromag- 
netismo lo constituyen los circuitos eléctricos, formados por una red de cables 
conductores por los que se hace circular una corriente eléctrica. Precisemos es- 
tos conceptos. Un conductor es una sustancia cuya estructura atómica permite 
que sus electrones pasen con facilidad de un átomo a otro. Los mejores con- 
ductores son los metales. Los electrones exteriores de los átomos metálicos no 
permanecen vinculados a ningún átomo en particular, sino que forman una nube 
compartida por todos los átomos. Por ello un trozo de metal puede considerarse 
como una molécula gigante. Cuando aplicamos un campo eléctrico constante a 
un electrón en el vacío éste emprende un movimiento con aceleración constante. 
No les sucede lo mismo a los electrones libres de un conductor, pues en presencia 
del campo van chocando de átomo en átomo, siendo absorbidos y reemitidos, lo 
que les provoca un retardo considerable y su movimiento a nivel macroscópico 
puede considerarse uniforme (sin aceleración) . Por otro lado, los choques hacen 
vibrar los átomos, lo que macroscópicamente se traduce en un calentamiento del 
conductor. Existe una fórmula sencilla avalada por la experiencia que permite 
tratar matemáticamente estos fenómenos y que se conoce como ley de Ohm. En 
su forma general puede enunciarse así: si aplicamos un campo eléctrico i? a un 
conductor, la densidad de corriente en cada punto vendrá dada por i = aE, 
donde a es una constante que depende del conductor y recibe el nombre de con- 
ductividad. La conductividad permite hablar de buenos y malos conductores. 
Un conductor es mejor cuanto mayor es su conductividad, pues significa que un 
mismo campo aplicado produce una corriente más intensa. 

Observar que el vector E, y por lo tanto i apunta hacia donde se movería 
una carga positiva situada en la posición considerada pero, como las cargas 
que se mueven son negativas, en realidad i tiene el sentido contrario al flujo 
de electrones. Desde un punto de vista matemático, una corriente de cargas 
negativas es equivalente a una hipotética corriente de cargas positivas que circula 
en sentido contrario, y en muchas ocasiones es más claro pensarlo así. 

Podemos distinguir entre corrientes de conducción, en las que los electrones 
que se desplazan son sustituidos por otros, de modo que la carga neta es siempre 
nula, y las corrientes de convección, en las que se produce una acumulación de 
electrones en unos puntos y un defecto en otros. Cuando las corrientes son de 
conducción podemos suponer que p = 0, reflejando el hecho de que cualquier 
integral de p en un volumen macroscópico será nula. La existencia de cargas en 
el medio ya está implícita en las constantes e y p específicas del conductor. 
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Veamos algunas consecuencias de la ley de Ohm aplicada a un circuito 
eléctrico. Podemos representar un tramo de cable eléctrico como una curva 
diferenciable j(s), aunque en realidad el cable será un tubo, digamos cilindrico, 
que rodea a 7. Sea k su sección (que podemos considerar constante o función 
del parámetro s). El conductor está rodeado de un medio aislante, de modo 
que sólo la parte de E en la dirección T tangente a 7 produce corriente. Así 
pues, la ley de Ohm debe ser adaptada a 1 = (ET)T. Con esto suponemos 
implícitamente que la densidad de corriente Tes la misma en cada sección trans- 
versal del conductor. Definimos la intensidad de corriente como / = kTi, es 
decir, / es el flujo de Ta través de la sección de cable en un punto dado o, lo 
que es lo mismo, la cantidad de carga (positiva) que la atraviesa por unidad de 
tiempo. 

Definimos la caída de tensión entre los extremos del cable como la circulación 
de E a través del mismo, o sea, 

— * rj~i j 

dV = ETds= — ds = — ds. 

a ka 

Así pues, V es el trabajo que realiza el campo eléctrico para transportar un 
culombio (positivo) de un extremo a otro del cable. Si recorremos el cable en el 
sentido de la corriente positiva (es decir, en sentido opuesto a la corriente real) 
V ha de ser positivo. En ausencia de campos magnéticos variables el campo 
eléctrico es conservativo y V es la pérdida de energía potencial que sufre la 
unidad de carga al recorrer el cable. En cualquier caso V debería coincidir 
con la energía cinética que el campo comunica a la carga, pero según hemos 
comentado ésta no gana ninguna energía cinética, pues su velocidad media es 
constante. En realidad V es la cantidad de calor que se genera por cada carga 
positiva que se transporta a lo largo del cable. Notemos que V se mide en 
voltios. 

Definimos la resistencia del cable como la integral de dR = ds/ka, que es 
una constante asociada al conductor. Si éste es homogéneo es simplemente 
R = L/ka, donde L es la longitud del cable, k su sección y a su conductividad. 
La unidad de resistencia es el ohmio. Notemos que la caída de tensión es dV = 
IdR. Si la intensidad es constante queda simplemente V = IR, que es la forma 
habitual de la ley de Ohm. 

Vamos a calcular el calor P que genera la corriente eléctrica por unidad de 
tiempo. Consideremos un elemento de cable de longitud ds. Sea dt el tiempo 
que la corriente tarda en recorrerlo. Durante este tiempo, la carga que sale 
del elemento de cable es exactamente la carga que contiene, luego ésta es I dt. 
Dicha carga recorre una distancia ds en el tiempo dt, lo cual le supone al campo 
un trabajo I dVdt. Así pues, dP = I dV — I 2 dR. Si la intensidad es constante 
queda P = I 2 R = V 2 / R, que es la ley de Joule. 

Observemos que dP = I dV = k{TT){ET) ds — Eidm, con lo que el segundo 
término del primer miembro de la ecuación (13.9) es ahora el calor desprendido 
por el cable por unidad de tiempo. 
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13.4 La ecuación de ondas 

En esta sección abordamos el problema matemático de resolver las ecuacio- 
nes en derivadas parciales que determinan los potenciales y los campos electro- 
magnéticos. Se define el operador d'alembertíano (tridimensional) de constante 
v > 0 como el que a cada función u en las variables x, y, z, t de clase C 2 le hace 
corresponder la función 

□ <9 2 u 2 ^ d 2 u 2 / d 2 u d 2 u d 2 u\ 
dt 2 " dt 2 \dx 2 dy 2 dz 2 ) 

Si u es una función vectorial (con valores en IR 3 ) su d'alembertiano se de- 
fine análogamente usando el laplaciano vectorial en lugar del escalar. Es claro 
entonces que U v u = (U v u\, O v u2, D v u¡). 

Similarmente se definen el d'alembertiano bidimensional (para funciones de 
x, y, t) y el unidimensional (para funciones de x, t). En todas las aplicaciones, 
las variables x, y, z representan una posición en el espacio y t representa al 
tiempo. La función u(x, y, z, t) representa la intensidad de una magnitud física 
que varía con el tiempo de forma distinta en cada punto. 

Cualquier ecuación en derivadas parciales de la forma U v u — w se llama 
ecuación de D'Alembert o ecuación de ondas, debido a que sus soluciones re- 
presentan procesos ondulatorios tales como la vibración de una cuerda o una 
membrana, la transmisión del sonido en un fluido o — lo que nos interesará 
especialmente en este capítulo — la luz. 

Si llamamos c = 1/^/ejllas ecuaciones (13.5), (13.6), (13.7) y (13.8) equivalen 
a las siguientes ecuaciones de ondas: 

(13.10) 
(13.11) 
(13.12) 
(13.13) 



D C V = 


2 

c z p 


e 


a c A = 


\xc 2 i 






a c E = 


-ív„ 




e 


a c H = 


c 2 rot 1. 



di 



La constante c depende del medio. Una simple comprobación muestra que 
las unidades de e son C 2 /Nm 2 y las de ¡i son Ns 2 /C 2 , con lo que las unidades 
de c son metros por segundo, es decir, corresponde a una velocidad. En el vacío 
vale 

3fi7T • 1 O 9 

— % = 3 • 10 8 m/s = 300.000 Km/s. 

47T • 10~ 7 

Ésta es aproximadamente la velocidad de la luz. Maxwell fue el primero en 
explicar la naturaleza de la luz en términos de la teoría electromagnética. Antes 
de entrar en ello debemos investigar las soluciones de la ecuación de ondas, que 
es lo que nos ocupa en esta sección. 
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Ecuación homogénea unidimensional Nos ocupamos en primer lugar de 
la ecuación 

d 2 u 2 d 2 u n 

v = 0, 

dt 2 dx 2 

es decir, de la ecuación de ondas unidimensional y homogénea. Para resolverla 
hacemos el cambio £ = x + vt, r¡ = x — vt. Según el convenio habitual, llamamos 
u(£, r¡) a la composición de u(x, i) con el cambio inverso. Aplicando la regla de 
la cadena tenemos 

du du du 

dt <9£ dr¡ 

du du du 

dx <9£ dr¡ 

d 2 u 2 d 2 u ^ 2 d 2 u 2 d 2 u 

dt 2 dt; 2 d^di] dr} 2 

d 2 u d 2 u n d 2 u d 2 u 

= h2 1 

dx 2 d£ 2 dS,dr¡ drj 2 

Al sustituir estas derivadas en la ecuación de ondas ésta se reduce a 

d " U =0. (13.14) 



d£,dri 

Esto significa que la derivada de u respecto de i] ha de ser una función /(£) 
que no dependa de rj. Por consiguiente 



rv 

= / m 



ds+h(o = m)+f2(v)- 



Recíprocamente, cualquier función de la forma u(£,rj) = /i(C) + f2(v)i P ar a 
ciertas funciones /i y /a de clase C 2 , es solución de (13.14). Deshaciendo el 
cambio de variable, concluimos que las soluciones de la ecuación de ondas son 
todas las funciones de la forma 



u{x,y) = h{x + vt) + f 2 {x - vt). (13.15) 

Ahora veamos que la ecuación tiene solución única si especificamos arbitra- 
riamente los valores de u y de su derivada respecto a t en un instante dado, es 
decir, vamos a probar que el problema siguiente tiene solución única u(x, i): 

& 2 u_ 2 (Pu ' 
dt 2 dx 2 
u(x,0) = <f>(x) > 

donde 0 es una función de clase C 2 y ip de clase C x . 
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Para que una solución u dada por (13.15) satisfaga las condiciones iniciales 
ha de cumplir 

fi(x) + f 2 (x) = cj>(x) 
v.f[{x)-vf 2 {x) = <p(x) 

De la segunda ecuación deducimos 

/i(a¡)-/ 2 (a;) = - / 4>(s) ds + C, 

v Jx 0 

y ahora resolviendo el sistema lineal de incógnitas fi(x) y f 2 (x) obtenemos 

h{x) = + ¿ J Tp(s)d S + ^ 

1 1 [ x c 

h(x) = 2^~2vJ ^ ds ~2 

Entonces (13.15) se convierte en 

, . 4>{x + vt) + <f>(x - vt) i r x+vt ,, s , /101 „ N 

¿ ¿v Jx-vt 

Esta fórmula indica que el valor u(x, t) es el promedio de los valores que 
tomaba u para t = 0 en los puntos x±vt más el promedio de la velocidad inicial 
en el intervalo [x — vt, x + vt] multiplicado por t. Recíprocamente, la situación 
inicial en un punto xo afecta en cada instante t a los puntos que distan de xq 
un máximo de vt. Así pues, la constante v es la velocidad con que se expande 
el radio de influencia del estado inicial de cada punto sobre el estado de u. 

La figura muestra los valores de u para 
tiempos distintos a partir del estado inicial 
determinado por una función <p en forma de 
cresta (la gráfica más alta) y velocidades nu- 
las (ip — 0). Vemos cómo la cresta se va 
achatando por el centro hasta dividirse en 
dos crestas menores, una que se mueve hacia 
la izquierda y otra hacia la derecha, ambas 
con velocidad v. Desde el punto de vista de una posición fija alejada de la per- 
turbación inicial, la función u comienza siendo nula, en un momento dado (tras 
el tiempo necesario para que el frente de onda llegue al punto) u comienza a 
crecer hasta llegar a un valor máximo y luego vuelve a decrecer hasta hacerse 
nula de nuevo. De existir una velocidad inicial ip, digamos de soporte compacto 
y con integral no nula, su efecto sobre los puntos alejados es permanente, en el 
sentido de que para tiempos t suficientemente grandes u terminará tomando el 
valor de dicha integral. 




462 



Capítulo 13. Aplicaciones al electromagnetismo 



Ecuación homogénea tridimensional A continuación nos ocupamos del 
problema 

& u 2 A 

w = vAu 

u(x,Q) = <¡>{x) 

du . n . , , . 

— (x,Q) - i>{x) 

donde ahora a; € IR 3 . Es natural conjeturar que una solución de esta ecuación 
vendrá dada por una fórmula que generalice de algún modo a (13.16). El primer 
término de (13.16) es la media de los valores iniciales de u en los puntos x ± vt, 
por lo que es razonable conjeturar que en el caso tridimensional aparecerá la 
media del estado inicial de u sobre la esfera de centro x y radio vt. Por ello 
conviene introducir la media esférica de una función u : R 3 — > R como la 
función 

M{u){x, r) = — L J u{y) da(y) = i- J ^ u(x + r£) dtr(0, 

donde cr representa la medida de Lebesgue en la esfera de radio r en la primera 
integral y en la esfera de radio 1 en la segunda. 

Para justificar el cambio de variable consideramos la aplicación /(£) = x + r£ 
y observamos que el plano tangente a la esfera de centro x y radio r en un punto 
x + r£ coincide con el plano tangente a la esfera de centro 0 y radio 1 en el punto 
£, y para todo par de vectores u, v en dicho plano. 

/ t '(dCT r )(^)(u, v) = da r (x + r£)(ru, rv) — r 2 da r (x + r£)(u, v) = r 2 dcri(£)(w, v), 

pues da r (x + r£)(u,v) y dai(£)(u, v) son ambos el área del paralelogramo de 
lados u y v. Por consiguiente ft(da r ) — r 2 da\ y basta aplicar el teorema 9.22. 

Observemos que la segunda integral en la definición de M(u) está definida 
para todo valor de r, no necesariamente positivo. De hecho es fácil ver que 
M(u)(x,r) = M(u){x,-r). Además M(u)(x,0) = f(x). 

La primera integral conecta directamente con el problema que estamos es- 
tudiando, pero la segunda es más fácil de manejar. Por ejemplo, nos permite 
calcular la derivada 



d_ 
dr 



M(u)(x,r) = / Vu(x + r£)€da(£). 

AlT h\í\\=i 



Notemos que ^ coincide con el vector normal unitario a la esfera en el punto 
£, luego la última integral es el flujo del campo Vu(x + r£). Podemos aplicar el 
teorema de la divergencia y resulta: 



f-M(u)(z,r) = — / Au(x + rO dm(0 (13.17) 
or 4tt J m¡<1 



4^£_ Au(y) dm(y). 



-x\\ <r 
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Supongamos ahora que u(x,t) es una solución de la ecuación de ondas. En- 
tonces las medias M(u)(x,r,t) tienen a t como parámetro. Sustituyendo Au 
por el valor que da la ecuación de ondas podemos continuar el cálculo anterior 
(para r > 0): 



d ., 1 f 1 d 2 u 

-M(u)(x, r,t) = — 2 J ^- 2W (y, t) dm(y) 



1 [ r d 2 [ ,,,,,, IT a&Míu), 

/ u(y,t)dcr(y)dp = 3^ / p ^ (x, p, t) dp. 

J\\y-x\\=p 



4 7rr 2 u 2 Qf2 7n„_^|| = „ ' r 2 V 2 ,/n <9í 2 

Ahora multiplicamos por r 2 y derivamos respecto a r: 
9 ( 2 dM(u)^ _ r 2 <9 2 M(u) 



<9r \ dr J v 2 dt? 
Claramente entonces 

19 2 rM(u) _ 1 9 / 2 aMftí)\ _ 1 d 2 M(u) 

r Q r 2 r 2 g r l dr ) v 2 dt 2 



Si llamamos M(u) = rM(u) tenemos 

<9 2 M(u) _ 1 d 2 M¡ñj 
dr 2 v 2 dt 2 



es decir, la función M(u)(x, r, t), pava un x fijo, cumple la ecuación de ondas 
unidimensional. Vamos a considerar a t como variable espacial (la que en el 
apartado anterior era x) y a r como variable temporal (la que en el apartado 
anterior era i) . Entonces la constante de la ecuación de ondas es 1/v y según el 
apartado anterior sabemos que 



M(u)(x, r, t) = h{x, t + r/v) + f 2 (x, t - r/v), 



pero tenemos M(u)(x, 0, í) = 0, luego fi(x, t)+f 2 (x, t) = 0. Así pues, la solución 
depende de una única función f(x,t) — fi(x,t) = —f 2 (x,t) y se cumple 



M(u)(x, r, t) = f(x, t + r/v) - f(x, t - r/v), 

luego 

M(u)(x, r,t)= 1 - (f(t + r/v) - f(t + r/v)). 

Ahora trataremos de recuperar u(x, i) a partir de las medias M(u)(x,r,t). 
Para ello notamos que u(x,t) — M(u)(x,0,t) = (2/v)f'(x,t). Por otra parte 

dr v dt v 

con lo que 

. , 2 ,., , drMíu), , IdrMiu), 

u{x,t) = -f(x,t) = 1 >- (x,vt,0) + ^(x,vt,0). 

v dr v dt 
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Para derivar respecto de r podemos hacer primero t = 0, y así 

¿- í u(y,0)da(y) 

l7rr J\\y-x\\=r 



drM{u) d 

dr ' <9r \ 47rr . 



(x,vt) 



drM ^%M)= d Wt {tM mx ,vt)). 



dr 



Por otra parte, 
drM(u) 



(x,vt,Q) 



1 

4nr 



du 

y—x\\=r ^ 



(y, t) da(y) 



(x,vt,0) 



-(-I 



ip(y) da{y) 



(rM(ip))(x,vt) = vtM(ip)(x,vt). 



(x,vt) 



En total 



d 

u{x,t) = — (tM(<f>)(x,vt)) +tM(i¡>)(x,vt). 
Explícitamente : 



(13.18) 



u(x, t) = 



1 



d 



dt \ AnvH 



4>{y) d<j{y) 



1 



y-x\\=vt 



Anv 2 t 



y-x\\=vt 



ip(y) du{y). 



Esto justifica la unicidad de la solución. Para probar la existencia hemos de 
ver que, para cualquier par de funciones </> de clase C 3 y tp de clase C 2 , la función 
dada por (13.18) satisface la ecuación de ondas con las condiciones iniciales <¡> y 
ip. Comencemos por éstas: 



u(.r.i)) = Xf(o)(>.())+ [t^M(4)(x,vt) 



+ 0 = <j>(x). 



í=0 



du 
dt 



(x,Q) 



2—M(<j>)(x, vt) + í— M(<f>)(x, vt) 



(x,0) 



;x,o) 

= Va- 



riemos usado (13.17) para probar que 



(x,0) 



dMU) . . n 

= «-¿F(M) = o. 



La suma de dos soluciones de la ecuación de ondas es también una solución, 
luego basta probar que los dos términos de (13.18) satisfacen la ecuación de 
ondas. Más aún, la derivada respecto de t de una solución es también solución, 
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luego basta ver que tM(tp)(x,vt) satisface la ecuación de ondas. Según (13.17) 
tenemos 



dt 



8M(^)(x,vt) 9M(V), . 1 f » ,/ v , / x 



= — 2 A / / i>(y)da(y)dT=^A T 2 M(Íj)(x,vT)dT. 

Multiplicamos por í 2 y derivamos respecto de í: 

| ^MW(^t) j^ 2A(¿2MW( ^ t)) 

Entonces 

1<9 2 . . 19 f 2 dM(ip)(x,vt) 



m2 (tM(^)(x,vt)) = ^ Ft (t 2 v ^ ' y J = ti AAf(i/i)(x, vt), 

es decir, 

^ (íM(^)(a;,vt)) = v 2 ¿\{tM^){x,vt)), 

como queríamos probar. 

La fórmula (13.18) muestra que la constante v admite la misma interpre- 
tación que en el caso unidimensional, es decir, se trata de la velocidad de la 
onda, o la velocidad a la que se desplazan las perturbaciones iniciales. Una dife- 
rencia importante es que en la solución tridimensional sólo aparecen integrales 
sobre los puntos a una distancia vt del punto x, y no sobre los puntos a distan- 
cia menor o igual que vt. Esto implica que las condiciones iniciales no pueden 
causar efectos permanentes. Si suponemos que tienen soporte compacto, para 
todo punto x existe un instante t a partir del cual u(x, i) se anula. 

Vamos a calcular la derivada que aparece en (13.18). Se trata de 



Ít- í <t>{x + vtt)d<j{£) = -i- / <f>(x + vtt)d*(Z) 
ot An ./ii/tn=i 47r ./||f|i=i 



vt 
4?r 



vt í 

+ -JZ / V^>(x + vt^da(0 

J\m\=i 



= T^ñ I <Kv) Mv) + / V0(y) da(y) . 

Por consiguiente, (13.18) equivale a 

< X ^)=T^2 / (cj){y)+V<j ) {y){y-x) + t^{y))da{y). 

nV 1 J\\y-x\\=vt 
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El caso bidimensional Aunque la ecuación de ondas bidimensional no nos 
va a hacer falta en las consideraciones posteriores sobre el electromagnetismo, lo 
cierto es que los cálculos de la sección anterior nos permiten resolverla rápida- 
mente, y la ecuación tiene interés en sí misma. Sus soluciones describen las 
vibraciones de una membrana, o las vibraciones de la superficie del agua provo- 
cadas por la caída de un objeto. Para resolver el problema 

(Pu _^ (d 2 u | 8 2 u' 



dt 2 \ dx 2 dy 2 
u{x,y,0) = 4>{x,y) 

-t^O, y, 0) = i)(x,y) 

basta notar que si u es una solución entonces la función ñ(x, y, z, t) — u(x, y, t) es 
solución del problema tridimensional determinado por las condiciones iniciales 
(p(x, y, z) = (f>(x, y), ip(x, y, z) = ip(x, y) — lo que prueba la unicidad — así como 
que una solución cualquiera ñ del problema tridimensional (con las condiciones 
iniciales <p y ip) no depende de la variable z (pues la función ,ü(x,y,z + k,t) 
es solución del mismo problema), luego determina una solución u(x,y,t) = 
u(x, y, 0, t) del problema bidimensional. 

Para trabajar con la fórmula (13.18) conviene cambiar la notación a x = 
(xi 7 x 2 ,x 3 ) identificando los puntos de K 2 con los de la forma (a; 1 ,x 2 ,0). En- 
tonces 

Puesto que </>(yi,2/2,2/3) = 0(2/1,2/2, —2/3), la primera integral es el doble de 
la integral restringida a la semiesfera y% > 0. Lo mismo se aplica a la segunda 
integral. Una carta de dicha semiesfera es 

X(yi,y 2 ) = V v 2 t 2 - (y 1 - x^ 2 - (y 2 - x 2 ) 2 = v 2 t 2 - \\x - y\\ 2 , 

donde en la última expresión consideramos x, y € IR 2 . Para esta carta 



luego 



da = — ; dyidy2, 
Vv 2 t 2 -\\x-y\\ 2 



u(x,t) = í—í , m dm(y) 

dt 2nv J lly - X]l<vt ^ v H2-\\ x -y\\2 



~í 

l7TV J\\y-x 



dm{y). 



2lTV J\\y-x\\<vt \/v 2 t 2 - \\x - y\\ 

Esta expresión muestra un comportamiento que difiere tanto del caso unidi- 
mensional como del tridimensional. Suponiendo condiciones iniciales con so- 
porte compacto, en el caso tridimensional la función u se anula pasado un 
tiempo, en el caso bidimensional se va atenuando pero nunca llega a anularse, 
mientras que en el caso unidimensional la situación depende de las condiciones 
iniciales. 
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La ecuación de ondas no homogénea Los resultados anteriores permiten 
estudiar el comportamiento del campo electromagnético en el vacío (en ausencia 
de cargas), pues en tal caso las ecuaciones de ondas que hemos obtenido para 
E, H y sus potenciales son homogéneas. Nos ocupamos ahora del caso general, 
es decir, del problema tridimensional 

Uu{x,i) = w(x,t) 

u(x,0) = <fi(x) 

Ante todo observamos que si existe solución es única, ya que si u\ y u 2 son 
soluciones del problema entonces u\ — u 2 es solución del problema homogéneo 
con condiciones iniciales nulas, luego u\ — u 2 = 0. Para probar la existencia de 
solución podemos suponer <f> = ip = 0, ya que una solución con otras condicio- 
nes iniciales se obtiene añadiendo a la de este caso una solución del problema 
homogéneo correspondiente. 

Para cada s > 0 consideremos el problema auxiliar 

Uu s {x,t) = 0 
u s (x,Q) = 0 
-Qf{x,0) = w(x,s) 

que nos da la onda que aparecería si a partir de una situación de reposo 0 = 0 
perturbáramos el medio con unas velocidades dadas por w(x,s). Su solución es 



u a (x,t) = — ^- / w(y,s)d<r(y). 



Para t > s definimos ü(x,t,s) = u s (x,t — s), que tiene la misma interpre- 
tación salvo que la perturbación aparece en el instante t = s en lugar de en 
t = 0. Entonces 



dt 2 dt 2 

ü(x,s,s) = u s (x, 0) = 0 

dü du s 

— (x,s,s) = —{x,0) = w{x,s) 



v Au s (x,t — s) = v Au(x,t,s) 



Finalmente definimos 
u(x 



,t)= í u(x,t,s)ds = — / f— — / w{y,s)da{y) ] ds, 

Jo 4ttv ¿ j Q yt- s j lly _ xll=v{t _ s) J 

que representa la acumulación de los efectos de todas las perturbaciones que han 
aparecido hasta el instante t. Vamos a probar que u es la solución del problema 
no homogéneo. Para derivar u respecto de t definimos 



u(x,ti,t 2 ) = / u(x,t 2 ,s)ds 
Jo 
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y aplicamos la regla de la cadena. El resultado es 



du 
dt 
(fu 
dt 2 



w(x,t) + / v 2 Au(x, t, s) ds = w(x, t) + v 2 Au(x, t) 
Jo 



u(x,t,t)+ / —(x,t,s)ds= / —(x,t,s)ds, 



j-(x,t,t) + / j—{x,t,s)ds 




Evidentemente u cumple las condiciones iniciales. Podemos expresar la so- 
lución de forma más simple. Mediante el cambio de variable s' = v(t — s) queda 



No olvidemos que a esta función hay que sumarle la de una ecuación ho- 
mogénea en caso de que las condiciones iniciales no sean nulas. 

13.5 Soluciones de las ecuaciones de Maxwell 

Con los resultados de la sección anterior podemos resolver las ecuaciones 
(13.10), (13.11), (13.12) y (13.13). Por ejemplo, la primera nos permite expresar 
el potencial eléctrico V en términos de la densidad de carga p. Se cumple 



En principio falta sumar una solución de la ecuación de ondas homogénea 
correspondiente a las condiciones iniciales de V, pero admitiendo que p tiene 
soporte compacto sabemos que dicha solución forma un frente de onda que se 
aleja a la velocidad de la luz y tras su paso no deja efecto alguno. En los 
problemas concernientes a regiones del espacio pequeñas en comparación con la 
velocidad de la luz podemos prescindir de esta parte. 

La fórmula anterior es similar a la del potencial electrostático (potencial 
newtoniano) salvo por el hecho de que para calcular la influencia en un punto 
x de la carga situada en un punto y no se tiene en cuenta la carga actual, sino 
la que había en un instante anterior, el correspondiente al tiempo que tarda 
la luz en ir de y a x. Por ello las funciones de este tipo se llaman potenciales 
retardados. Vemos, pues, que los efectos en el potencial de una variación de 
la distribución de las cargas en una región no se hacen notar instantáneamente 
en todo punto, sino que se transmiten al espacio circundante a la velocidad 
de la luz. Si las distancias a considerar son pequeñas en comparación con la 
velocidad de la luz, podemos suponer que la integral se calcula sobre todo R 3 
(o sobre todo el soporte de p) e incluso prescindir del término ||y — x\\/c, con 





(13.19) 
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lo que obtenemos exactamente el potencial electrostático. Por consiguiente, el 
potencial eléctrico puede suponerse newtoniano en todos los problemas que no 
involucran distancias astronómicas (lo que supone considerar que las variaciones 
de la distribución de las cargas alteran instantáneamente el potencial). 

Las mismas consideraciones valen para el potencial magnético, que según la 
ecuación (13.11) viene dado por 



Así mismo, las ecuaciones (13.12) y (13.13) proporcionan expresiones simi- 
lares para E y H. 

Ejemplo Vamos a calcular el campo electromagnético creado por una co- 
rriente alterna. Primero veremos algunas generalidades sobre este tipo de co- 
rriente. En principio una corriente alterna es una corriente que cambia de 
sentido periódicamente, de modo que pasa de un valor máximo I 0 a un valor 
mínimo —I 0 en un tiempo T/2, de modo que al cabo de un tiempo T toma 
el mismo valor I 0 . El caso más simple consiste en suponer que la variación es 
sinusoidal, es decir, que la intensidad en un tiempo t viene dada por 



donde w = 2n/T. El tiempo T se llama período de oscilación y es el tiempo 
que I tarda en volver al mismo estado. El inverso l/T se llama frecuencia de la 
oscilación y es el número de oscilaciones que se producen por unidad de tiempo. 
Su unidad (1/segundo) se llama hercio. La constante 4>o recibe el nombre de 
ángulo de fase. Eligiendo el origen de tiempos podemos suponer <fio = 0. Todos 
estos conceptos se aplican a cualquier magnitud que varíe sinusoidalmente en 
el tiempo. En general, si Acos(u)t + <p a ) y Bcos(u;t + </>i) son dos magnitudes 
sinusoidales con el mismo período, se dice que presentan un desfase de (f>i — 0 O 
radianes. Cuando el desfase es nulo se dice que ambas están en fase. Cuando 
digamos que dos magnitudes sinusoidales están desfasadas, sin indicar el desfase, 
se entenderá que éste es de tt/2 radianes. Dos magnitudes con este desfase 
pueden representarse por Acos(uit + <¡>q) y Bsen(ojt + <¡>q). 

Volviendo a la intensidad (13.21), en principio se trata de la intensidad en un 
punto dado del cable eléctrico. Esta no tiene por qué ser la misma en todos los 
puntos al mismo tiempo, pero ahora no vamos a entrar en ello. Concentrémonos 
en buscar la mejor forma de tratar con magnitudes sinusoidales. 

Resulta que lo más adecuado es sustituir los cosenos por exponenciales com- 
plejas. En efecto, la fórmula anterior (con <j> 0 = 0) puede escribirse como 



En lo sucesivo escribiremos simplemente I(t) = Ioe ÍUJt , es decir, a partir de 
ahora 7(í) no será la intensidad, sino la función compleja cuya parte real es 
la intensidad y cuya parte imaginaria es la intensidad desfasada (en — ir/2 ra- 
dianes). Lo mismo valdrá para todas las magnitudes sinusoidales con las que 




(13.20) 



I(t) = I 0 cos(ujt + 0 O ), 



(13.21) 



/(í) = Re(7 0 e^ t ). 
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trabajemos. El teorema 12.9 garantiza que si derivamos la función compleja 
asociada a una magnitud sinusoidal obtenemos la función compleja asociada a 
su derivada. 

Vamos a estudiar el modelo mas simple de corriente alterna. Supongamos 
que el conductor es un segmento muy pequeño de longitud h cuyo centro está 
en el origen de coordenadas y se extiende en la dirección del eje z. En tal caso 
podemos suponer que la intensidad es la misma en cada instante a lo largo de 
todo el circuito y viene dada por / = Ioe lult . La fórmula (13.20) muestra que 
el potencial magnético en cada punto tiene la dirección del eje z. Además si el 
conductor tiene sección k podemos hacer dm — kds, donde ds es el elemento 
de longitud del mismo y así 

4tt J n \\y-x\\ 4tt ,¡ 1 h~ x \ 

donde -y(s) = (0, 0, s), para s € [— h/2, h/2]. Si nos centramos en puntos alejados 
del conductor, la distancia \\y — x\\ es equiparable a ||ir||, con lo que el integrando 
se vuelve constante y resulta 

_ Uh I(t- \\x\\/c) _ JjMQ_ • t • || X || 

Z ~ A lili t II II ^ ^ ) 

47r ||x|| 47r||x|| 

donde k = lú/c. 

Es importante observar que al sustituir / por su valor estamos suponiendo 
que el circuito ya oscilaba en el instante t — ||a;||/c, o lo que es lo mismo, que 
un rayo de luz ha tenido tiempo de llegar desde el origen hasta el punto x en 
el tiempo que dura la oscilación. Si, por ejemplo, suponemos que la fórmula 
/ = Ioe íuJt es válida para t > 0 y que antes no había corriente, entonces la 
fórmula anterior vale para t > ||a;||/c y antes el potencial es nulo. 

Observamos que A oscila con periodo T, al igual que la corriente, sólo que 
entre puntos distintos existe un desfase determinado por el factor es 1 1 ^ 1 1 . No 
podemos calcular el potencial eléctrico V a partir de la fórmula (13.19), pues 
ello nos obligaría a estudiar las variaciones locales de la densidad de carga. En 
su lugar razonamos como sigue: el potencial eléctrico debe oscilar también con 
periodo T, es decir, ha de ser de la forma V = f{x)e l ^ t+ ' t ' a ^\ luego 

r)V 

= iLüf(x)e l( " t+ ^ (x » = ilüV. 
Por el mismo razonamiento 

dA 

— = íujA. (13.22) 



La condición de Lorentz (13.4), que hemos impuesto a los potenciales, nos 
da ahora que 
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A partir de aquí los cálculos se simplifican mucho si pasamos a coordenadas 
esféricas. Notemos que el tercer vector de la base canónica es 

Vz = V(rcos#) = cos9v r — sen 9 ve . 



Por consiguiente 
Ag 

A á 



fihl 0 



A z eos 6 = — — -e"~"e 
4nr 



iuit — inr 



eos 9, 



-A z sen9 = ^e iut e~ ÍKr sene, 



0. 



Ahora es fácil calcular 



H = - rot A 



¡j,r 2 sen 9 



v r rvg 

dr dB 

A r rAg 



r sen 9 
0 
0 



lo que nos lleva a H r = Hg = 0 y 

I 0 h 



47T 



+ 



sent 



Por otra parte, (13.23) nos lleva a 

y _ [ilph j^f c -ÍKr 

4ir 



nr 



luí 



cosí 



Esto juntamente con (13.22) nos permite calcular 

3 A 

E = - VV - = - VV - íujA. 
ot 

tras un cálculo rutinario obtenemos 



E r — 



Eg = 



Ioh 

47T 

Ioh 
4n 
0, 



gíürtg-i/ír 



27/ 



+ - 



( iíújJL 



V r 



+ 4 + 



cose 

1 

ii¡úer z 



sen ( 



donde r¡ = yji/e es una constante cuyas dimensiones son las de una resistencia 
y en el vacío vale n 0 « 12Ü7T ohmios. 

Para puntos alejados del circuito emisor los términos en 1/r 2 y 1/r 3 son 
despreciables frente a los términos en 1/r, con lo cual una buena aproximación 
al campo electromagnético creado por el mismo es 



H(j> 
Eg 



inl 0 h 

iiv/iloh 
4nr 



e iujt e- ÍKr sent 



sen 9, 



(13.24) 
(13.25) 
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con las componentes restantes nulas o muy pequeñas. Geométricamente, esto 
significa que los campos E y H son perpendiculares entre sí y perpendiculares 
al radio que los une con el circuito emisor. Notemos además que Eg = nH^, 
luego los campos están en fase. 

En resumen, el circuito está rodeado de un campo electromagnético que 
ocupa un volumen esférico cuyo radio se extiende a la velocidad de la luz. En 
cada punto de este volumen el campo oscila con período T, la intensidad máxima 
de los campos varía entre 0 en el eje Z y un valor máximo en el plano XY . Fijada 
una recta que pase por el origen, la intensidad máxima de los campos disminuye 
en proporción inversa a la distancia. Además la oscilación está desfasada en nr 
radianes, de modo que los campos en dos puntos de la recta están en fase si 
y sólo si su distancia es un múltiplo de A = 2-k/k = cT metros. Este valor se 
llama longitud de onda. 

Observemos que (con las aproximaciones que hemos hecho) el vector de 
Poynting es siempre perpendicular a las esferas de centro en el origen y apunta 
siempre hacia fuera de las mismas. Por lo tanto, aunque es oscilante, su osci- 
lación no es sinusoidal, sino que depende de un seno al cuadrado. La intensidad 
(el módulo) del vector de Poynting en un punto y en un instante dado es 



P=\\E\\ \\H\\ = 



K 2 T 2 h 2 T 2 h 2 n 

0 2/i 2 / \ 0 / 2/i 2/ \ 

„ „ „ „ 77 sen 9 sen (cot — Kr) = - - „ „ sen 9 sen (vt — Kr), 
Í6n 2 r ¿ \\ ¿ r ¿ 



de modo que P oscila entre 0 y un valor máximo con período T/2. Para una 
magnitud que oscila de este modo tiene sentido calcular su valor medio, definido 
como 

T/2 



2 r /¿ 

P m (r,6) = - J P(r,9,t)dt. 



Concretamente 

T2u2„ i r ir-Kr T 2 h 2„ 



J2^2 -y p-K-Kr I 2 h ri 2 

Pm(r,9) = ° „ sen 2 #— / sen 2 x dx = °„ „ sen 2 9 vatios /metro . 
4A' ¡ H 7r J_ Kr 8\ ¿ r 2 

La potencia irradiada, o cantidad de energía electromagnética que atraviesa 
por segundo una esfera de centro en el conductor es el flujo del vector de Poynting 
a través de la esfera, es decir, 

W(r,t) = í Pda= í P(r,e 7 t)r 2 sen9d9 A# 
Js r Js r 



2f,2^ Í-27T 

^0 JO 

sen 2 (wí— Kr) vatios. 



J 2 h 2 n 

-|^sen 2 (wí-Kr) / / sen 3 6 d6d<t> 
2nl 2 h 2 n 



3A 2 

La potencia W depende de r únicamente en el desfase entre puntos situados 
a distancias distintas del circuito. Sin embargo la potencia media no depende 
de r, pues se comprueba fácilmente que vale 

W m = ^^^40n 2 I 2 — vatios. 
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Ésta es la energía que irradia por segundo el circuito. (En un tiempo nT, 
con n natural, la energía irradiada será nW m . Si n no es natural el valor nW m 
es aproximado.) 

Hemos visto que el campo determinado por el vector de Poynting es radial, 
pero en regiones alejadas de la fuente de radiación podemos considerarlo para- 
lelo. Escogiendo adecuadamente el sistema de referencia podemos suponer que 
tiene la dirección del eje X, así como que los campos H y E tienen, respectiva- 
mente, la dirección de los ejes Y y Z. Entonces las ecuaciones (13.24) y (13.25) 
son aproximadamente 

I 0 hsen6 I 0 hsen6 
H = — — sen(wí — Kx)e 2 , E = r¡ — — sen(cjí — nx)e 3 , 

donde ahora 9 es constante. Si la longitud de onda A es pequeña, una variación 
moderada de x altera en muy poco el factor 2\x, con lo que la intensidad de la 
onda se puede considerar constante y queda 

H = A sen(wí — nx)e2, E = r¡A sen(cjí — Kx)e¡, 

para una cierta constante A. Esta es la forma más simple que puede adoptar el 
campo electromagnético en el vacío. Es lo que se llama una onda plana (porque 
el frente de ondas es plano) , transversal (porque los campos varían perpendicu- 
larmente a la dirección de avance) , monocromática (porque la variación en cada 
punto es sinusoidal) y polarizada (porque E y H varían siempre en la misma 
dirección) . 

Las ondas electromagnéticas monocromáticas se clasifican por su longitud 
de onda: 

Ondas de radio 30 Km > A > 400 /¿m 

Rayos infrarrojos 400 /jm > A > 0,8 /xm 
Luz (visible) 0,8 /¿m > A > 0,4 ¡im 

Rayos ultravioletas 0,4 ¡im > A > 120 Á 
Rayos X 120 Á > A > 0,05 Á 

Rayos 7 0,05 Á > A 

Hemos usado el micrómetro o miera, abreviado /im, igual a una milésima 
de milímetro, y el Angstrom, abreviado Á, igual a 10~ 10 m. Las ondas mono- 
cromáticas de longitud entre 0,8 y 0,4 mieras son casos particulares de lo que 
comúnmente llamamos "luz" . El ojo humano percibe la longitud de onda en 
forma de color. Las longitudes cercanas a 0,8 mieras corresponden a la luz roja, 
mientras que las cercanas a 0,4 mieras corresponden a la luz violeta, pasando 
por toda la gama del arco iris. Los colores que no aparecen en el arco iris, 
como el marrón, corresponden a superposiciones de luz de distintas longitudes 
de onda. ■ 
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